22秋学期(高起本1709-1803、全层次1809-2103)《并行程序设计》在线作业-00002
试卷总分:100 得分:100
一、单选题 (共 50 道试题,共 100 分)
1.下面哪种架构最适合数据并行____。
A.SISD
B.SIMD
C.MISD
D.MIMD
2.在使用条件变量之后必须对其进行____。
A.初始化
B.加锁
C.解锁
D.销毁
3.在使用信号量之后必须对其进行____。
A.初始化
B.解锁
C.减1
D.销毁
4.采用划分子矩阵方法实现矩阵乘法,会将程序的主体三重循环变为____重循环。
A.4
B.5
C.6
D.7
5.为持续提高CPU性能,以下说法正确的是____。
A.只需不断增加器件集成密度
B.只需不断提高频率
C.必须利用并行技术
D.只需提高功耗
6.我国首次获得戈登?贝尔奖是在____年。
A.2015
B.2016
C.2017
D.2018
7.将t个线程的局部结果汇总,可采用递归分解并行进行,即,两两汇总,中间结果继续两两汇总,直到剩下唯一的最终结果,其时间复杂度为____。
A.Θ(1)
B.Θ(logt)
C.Θ(t)
D.Θ(tlogt)
8.在编写使用n个线程进行n个数求和的OpenMP的程序时采用临界区技术,则多线程版本____串行版本。
A.肯定快于
B.肯定慢于
C.可能快于
D.以上皆错
9.对于效率E,下面描述错误的是____。
A.理想并行E=1
B.总是在0~1之间
C.可能>1
D.可能随着处理器数量增大趋向于0
10.n个节点的线性阵列构造成本为____。
A.O(logn)
B.O(sqrt(n))奥鹏作业答案请进open5.net或请联系QQ/微信:18866732
C.O(n)
D.O(nlogn)
11.MPI默认点对点通信模式是____。
A.阻塞的
B.非阻塞的
C.对等的
D.主从的
12.n个处理器、n个内存模块的交叉开关构造成本为____。
A.O(logn)
B.O(n)
C.O(nlogn)
D.O(n^2)
13.n个元素排序问题,如果只能通过元素比较交换构造算法,则n个处理器的并行排序算法达到____的运行时间才是代价最优的。
A.O(logn)
B.O(n)
C.O(nlogn)
D.O(n^2)
14.OpenMP的缺点不包括____。
A.常见并行结构的表达并不总可行
B.局部性处理不易
C.不易编写多核单核通用程序
D.性能控制不易
15.OpenMP编译指示中说明私有变量是用____子句。
A.private
B.shared
C.schedule
D.nowait
16.编写矩阵乘法的SSE程序,若矩阵元素为单精度浮点数,则应对矩阵乘—加计算的循环进行____路循环展开。
A.2
B.4
C.8
D.16
17.SSE intrinsics _mm_loadu_ps命令的功能是____。
A.对齐向量读取单精度浮点数
B.未对齐向量读取单精度浮点数
C.对齐向量读取双精度浮点数
D.未对齐向量读取双精度浮点数
18.动态线程编程模式的缺点是____。
A.线程管理开销高
B.系统资源利用率低
C.线程任务分配困难
D.线程通信效率低
19.动态线程编程模式的优点是____。
A.线程创建开销低
B.线程管理开销低
C.线程终止开销低
D.系统资源利用率高
20.OpenMP的优点不包括____。
A.从头编写并行程序很自然
B.串行程序并行化简单
C.不必关心低层细节
D.可移植、可扩展
21.____不是SIMD架构。
A.SSE
B.超线程
C.AltiVec
D.Neon
22.计算并行起泡排序算法的加速比,应该选择____串行算法的运行时间作为串行时间。
A.起泡排序
B.插入排序
C.快速排序
D.归并排序
23.关于互斥量mutex,下面说法错误的是____。
A.它将保护区域内的运算变成原子操作
B.任何时刻只允许一个线程进入保护区域
C.保险起见,对并发操作都应用互斥量保护
D.互斥量加锁、解锁开销远大于一般运算
24.采用MPI主从模型解决矩阵每行排序问题,主进程每次向一个从进程发送10行作为一个任务相对于每次发送1行的缺点是____。
A.更不利于负载均衡
B.增大了通信开销
C.提高了计算次数
D.增加了从进程空闲
25.有大量分支指令的程序不适合下面哪种体系结构上进行并行化?
A.SISD
B.SIMD
C.SPMD
D.MIMD
26.在使用条件变量时,还需配套使用一个____。
A.互斥量
B.信号量
C.障碍
D.自旋锁
27.OpenMP编译指示是以____开头的。
A.”#include”
B.”#ifdef”
C.”#pragam”
D.”#else”
28.SIMD并行架构的优点不包括____。
A.辅助提供更大并发度
B.设计简单
C.编程简单
D.更小的芯片尺寸
29.新一代GPU重点提供的新特性不包括____。
A.新型高速显存
B.GPU间直接高速互联
C.自动并行化
D.人工智能计算专门优化
30.当前并行软件面临的主要挑战不包括____。
A.能耗
B.伸缩性
C.研发周期
D.可靠性
31.下列哪门课程不是并行程序设计的先导课?
A.计算机概论
B.高级语言程序设计
C.计算机体系结构
D.数据库系统
32.第一款桌面多核CPU是____发布的。
A.Intel
B.AMD
C.IBM
D.SUN
33.CUDA的优点不包括____。
A.可移植性
B.入门简单
C.标准的SPMD模式
D.不再需要图形API
34.当处理器数量和问题规模同时增大,____能保持效率恒定。
A.所有算法都
B.所有算法都不
C.部分算法
D.以上皆错
35.单程序多数据流模式是针对____架构的。
A.SISD
B.SIMD
C.MISD
D.MIMD
36.对于起泡排序程序两层循环是否存在数据依赖,下面说法正确的是____。
A.外层存在,内层不存在
B.外层不存在,内层存在
C.两层都不存在
D.两层都存在
37.一个SSE寄存器可容纳____个短整型数。
A.2
B.4
C.8
D.16
38.使用一个信号量实现“主线程等待4个从线程完成任务”,信号量初始值应设置为____。
A.0
B.1
C.2
D.4
39.MPI_Send和MPI_recv是通过____区分消息。
A.端口号
B.消息名
C.消息标签
D.消息哈希
40.编写矩阵乘法的AVX程序,若矩阵元素为双精度浮点数,则应对矩阵乘—加计算的循环进行____路循环展开。
A.2
B.4
C.8
D.16
41.采用划分子矩阵方法实现矩阵乘法,在进行SSE并行化时,是对(由外至内数)第____层循环进行循环展开然后向量化。
A.3
B.4
C.5
D.6
42.在使用条件变量之前必须对其进行____。
A.初始化
B.加锁
C.解锁
D.销毁
43.OpenMP中指定多线程中只有主线程执行代码块的指令是____。
A.omp single
B.omp master
C.omp slave
D.omp parallel
44.OpenMP主要是通过____来更高层抽象的多线程编程。
A.设计实现新的语言
B.为现有语言提供大量库函数
C.为现有语言扩展编译指示
D.新编译器实现自动并行化
45.对于障碍同步机制,以下说法错误的是____。
A.SIMD架构无需障碍机制
B.是一种群体同步机制
C.可用信号量实现
D.无法用其他同步机制实现
46.SSE intrinsics _mm_store_ps命令的功能是____。
A.对齐向量存单精度浮点数
B.未对齐向量存单精度浮点数
C.对齐标量存单精度浮点数
D.未对齐标量存单精度浮点数
47.OpenMP中多线程间是一种____关系。
A.主从
B.分组
C.对等
D.竞争
48.pthread_join的第二个参数的作用是____。
A.设置指定线程属性
B.获取指定线程属性
C.向指定线程传递参数
D.获取指定线程函数返回结果
49.SSE寄存器A中元素为A1 A2 A3 A4(均为由低到高),则执行C=shuffle(A, A, 0x1B)后,C中元素为
A.A1 A2 A3 A4
B.A2 A1 A4 A3
C.A3 A4 A1 A2
D.A4 A3 A2 A1
50.当条件判断____时,控制流语句SIMD并行化可能达到较好效果。
A.绝大部分结果为真
B.绝大部分结果为假
C.全部结果都一样
D.绝大部分结果都一样
转载请注明:奥鹏作业之家 » 【奥鹏】南开22秋学期《并行程序设计》在线作业