`

MPI中可能会出现的错误

 
阅读更多

转自:

http://hi.baidu.com/linzch/blog/item/7e7d750e18329ec07acbe14f.html

1. p1_xxxxx: p4_error: interrupt SIGSEGV: 11

这个错误可能是因为某个进程中出现了段错误引起的,自己编程中曾出现过的错误:

a.只在一个进程中给指针申请空间,而在其他进程没有申请,所以在广播的时候出错。
b.数组内存的越界使用。

网上有个人说的很好:
"There are 2 things to check.
** Run one of the test programs like pi3.f or cpi.c to see whether your cluster's OK.
** if it is, the fault is in your code. See if you're exceeding array bounds or accessing memory which you haven't allocated, There's a SIGSEGV error - that's a segmentation violation. That might explain stuff like
bm_list_21829: p4_error: interrupt SIGINT: 2

Once you have a seg. violation, all the 4 processors are sent a signal to interrupt the process (SIGINT). Signals are defined in /usr/include/sys/signal.h (at least on the SGIs; might be
different on other systems). "

2. p1_10401: p4_error: : 14


1 - MPI_BCAST : Message truncated
[1] Aborting program !
[1] Aborting program!

这个也是由于mpi_bcast的接收空间不够引起的,要在mpi_bcast之前分配足够大的空间,这样就不会truncated了

3. p4_error: alloc_p4_msg failed:

p0_6773: (7.828703) xx_shmalloc: returning NULL; requested 1048616 bytesp0_6773: (7.828762) p4_shmalloc returning NULL; request = 1048616 bytes 内存空间没分配足,可以通过设置环境变量P4_GLOBMEMSIZE (in bytes)来增大程序需要的内存空间
export P4_GLOBMEMSIZE=32000000 (for bash users) setenv P4_GLOBMEMSIZE 32000000 (for csh or tcsh users)



4.libcprts.so.5: cannot open shared object file: No such file or directory


/home/jbrandt/tests/test.exe: error while loading shared libraries:libcprts.so.5: cannot open shared object file: No such file or directoryp0_792: p4_error: Child process exited while making connection to remoteprocess on compute-0-0.local: 0/opt/mpich/intel/bin/mpirun: line 1: 792 Broken pipe /home/jbrandt/tests/test.exe - p4pg /home/jbrandt/tests/PI646 -p4wd /home/jbrandt/tes

没有用-static静态的连接,用-static重新编译就好了

分享到:
评论

相关推荐

    MPI中可能会出现的错误收藏.doc

    MPI中可能会出现的错误收藏.docMPI中可能会出现的错误收藏.doc

    MPI函数的参考手册

    除MPI_Wtime和MPI_Wtick外,Fortran接口子程序比C接口函数在最后多出一个整型参数,用于返回错误码。 所列出的MPI 函数和变量是按照它们的类别组织的。为方便查找特定的函数,附3.1 中给出了一个MPI 的函数、变量...

    西门子PRODAVE MPI的错误列表

    将该文件放在程序所在目录下,即可通过error_message函数获得错误的具体信息,便于调试和发现问题。 具体信息可参见上传的另一资源“西门子Prodave S7 V5.6工具箱英文手册"第57页。

    MPI参考手册 MPI函数的C接口

    给出主要MPI函数的参考手册。为了节省篇幅,这里仅列出MPI函数的C接口,Fortran 接口子程序的参数与C 接口函数的...除MPI_Wtime和MPI_Wtick外,Fortran接口子程序比C接口函数在最后多出一个整型参数,用于返回错误码。

    台达Siemens S7 300 (Direct MPI).pdf

    台达Siemens S7 300 (Direct MPI)pdf,台达Siemens S7 300 (Direct MPI):此通信协议可支持多台人机与多台PLC连线。多对多连线的情况,建议一台PLC最多同时与两台人机通讯,人机超过两台时通讯效率不高,也容易引起...

    高性能计算并行编程技术—MPI并行程序设计

    该文档详细阐述了MPI环境的配置 主要函数及常见错误问题解答

    babbage-project-mpi

    从Github下载 在babbage的主目录中,运行: git clone https://github.com/mbogden/babbage-project-mpi.git 创建虚拟环境 移至项目目录并运行虚拟环境脚本 cd babbage-project-mpi ...test_foo.e *是错误文件

    mpi_python:一个简单的示例,演示在Python扩展中使用MPI的问题

    会产生以下错误消息: [aia256:15841] mca: base: component_find: unable to open /pds/opt/openmpi-1.8.7/lib64/openmpi/mca_shmem_posix: /pds/opt/openmpi-1.8.7/lib64/openmpi/mca_shmem_posix.so: undefined ...

    bitonic_sort_mpi:bitonic_sort

    bitonic_sort_mpi bitonic_sort 这是双调排序的通用 C++ 实现。 我已经用各种数量的进程和数据大小对其进行了测试。 但是,如果您遇到错误,请提交问题。 它在类型 T 和 < 比较器上采用 Range。 它返回一个排序的...

    simple-mapreduce:使用C ++和MPI构建的MapReduce应用

    免责声明在此项目中构建的Mapreduce可能没有正确的结构。 这是基于论文[ ]构建的,但是某些部分可能会出错。 此外,此功能已通过带有文字计数任务的多个文本进行了测试,但尚未经过全面测试,因此可能存在错误。目录...

    ifix S7A与PlcSim数据通讯探讨

    (1)在ifix的过程数据库通过S7A驱动对PlcSim进行数据读取的时候,绝对不可以在Step7软件中打开监视监视DB块或者程序,如果这样,则PlcSim会崩溃,Step7也会错误,直接导致必须注销系统后才能恢复正常。 (2)如果...

    mpi_logistic_regression:使用 MPI 并行化的逻辑回归的 C++ 实现

    使用 MPI 进行数据并行化,加快速度。 // 啊哈! 以错误的方式计算的梯度(LogisticRegression::local_evaluate) // 但是,为什么它仍然工作良好(AUC ~ 0.79 )?

    用MATLAB求解薛定谔方程代码-QuickNLSE:使用CUDA、MPI和C的高性能NLSE求解器

    最后说明:这项工作是无证的、凌乱的,并且很可能存在错误(数学和计算方面的错误)。 我正在为 NLSE(可能还有 paralobic SE)开发一个新的 CUDA 库。 请使用我的其他求解器中的一个或一个,Crodinger(在 C 中)或...

    西门子PLC S7-400 S7 单边通讯

    适用于西门子PLC之间的通讯,工业现场适用,编程简单方便

    浅谈西门子Prodave6.0在C#中的应用

    首先从W95_S7.DLL中导入连接函数,访问权限为私有,C#将会对此函数进行封装,供外部调用,稍后讲解. 1/**//// 与PLC建立连接,该函数必须在其他所有函数调用之前被调用 2/// 3/// 连接数,在DOS,WIN3.1最多可以有4个,在...

    hindsight-experience-replay:这是Hindsight Experience Replay(HER)的pytorch实施-在所有提取机器人环境中进行实验

    pytorch = 1.0.0(如果使用pytorch-0.4.1,则可能会出现数据类型错误。稍后我将对其进行修复。 ) mpi4py 待办事项清单 支持GPU加速-尽管我添加了GPU支持,但是如果您没有强大的计算机,我仍然不建议您使用。 为...

    MapReduce简介

    MPI等并行计算方法缺少高层并行编程模型,为了克服这一缺陷,MapReduce借鉴了Lisp函数式语言中的思想,用Map和Reduce两个函数提供了高层的并行编程抽象模型 上升到构架:统一构架,为程序员隐藏系统层细节 MPI等...

    论文研究-静态栅栏分析中反例生成的改进.pdf

    栅栏分析器生成反例以帮助MPI程序员诊断同步错误。然而,对于某些真实程序现有的反例生成方法不支持快速的错误诊断。提出了一种改进的反例生成方法。该方法记录了多值表达式的传播历史并且能够推导出触发同步错误的...

    第七章-《大数据导论》大数据处理平台.pdf

    数据访问瓶颈 大数据处理平台的特点 通过分布式计算框架来实现 提供高效的计算模型和简单的编程接口 可扩展性:通过增加资源以满足不断增加的性能和功能需求 容错能力:考虑系统的不可靠性,支持出现错误后自动恢复 ...

    Random_projects

    可能存在一些错误,或者存在一些更好的实现。 无论如何,如果有任何问题,请随时给我留言。专案项目包括:斐波那契数注意:我使用的并行算法基于分而治之。 我尝试了许多其他方法,但是结果并不总是一致的。 有许多...

Global site tag (gtag.js) - Google Analytics