形考任务四:客观题
试卷总分:100 得分:100
1.下列关于数据预处理的描述中,描述不正确的是( )。
A.数据清洗的目的是为了提高数据质量
B.空值一定要删除
C.数据预处理包括数据的清洗、合并、重塑与转换
D.在Pandas中,缺失值使用NaN表示
2.下面关于dropna()的axis参数描述中,说法正确的是( )。
A.默认axis=0,删除包含缺失值的列
B.默认axis=0,删除包含缺失值的行
C.默认axis=1,删除包含缺失值的列
D.默认axis=1,删除包含缺失值的行
3.下列关于Matplotlib库的描述中,说法不正确的是()。
A.Matplotlib是当前用于数据可视化的最流行的Python包之一
B.Matplotlib提供了绘制散点图、条形图、折线图、饼图、直方图的方法
C.可通过交互方式实现数据可视化
D.Matplotlib不能支持中文显示
4.plot(x,y)的命令含义是( )。
A.打印
B.输出
C.绘图
D.计算
5.想要在数据集df第1列前插入一列[88,90,69,65,89,82],列标签是“C语言”。下列代码正确的是( )。
A.df.insert(1,”C语言”,[88,90,69,65,89,82])
B.df.insert(0,”C语言”,[88,90,69,65,89,82])
C.df.add(1,”C语言”,[88,90,69,65,89,82])
D.df.append(1,”C语言”,[88,90,69,65,89,82])
6.Pandas提供了isnull()函数和notnull()函数来检测数据中是否存在缺失值。
7.在Pandas中可以实现数据合并的方法只有concat()。
8.数据转置是指对数据的行列进行互换,在这个过程中数据的形状改变,数据逻辑也发生变化。
9.有如下数据集df,
{图}
要增加一列“总成绩”,实现如下图的效果:{图}
那么正确的代码是( )。
A.df[‘总成绩’]=0
B.df[总成绩]=0
C.df[‘总成绩’]=[0,0,0,0,0,0]
D.总成绩=0
10.从如下程序生成的数据集中只提取语文和数学奥鹏作业答案请进open5.net或请联系QQ/微信:18866732这两列,下列选项中代码正确的是( )。
import pandas as pd
data = {‘语文’: [86,99, 68, 83, 79, 91],
‘数学’:[78,66,58,75,77, 59],
‘英语’: [68, 99, 68,83, 79, 91],
‘地理’: [88, 90, 78,63, 100, 71]}
df= pd.DataFrame(data,index=[‘李东’,’李力’,’王平’,’赵平’,’张也’,’马云’,])
df
A.df[‘语文’ , ‘数学’]
B.df[ [‘语文’ , ‘数学’] ]
C.df[ { ‘语文’ ‘数学’ } ]
D.df.iloc[[‘语文’,’数学’]]