医学论文常用的数据校验

5个回答默认排序

默认排序

按时间排序

开开｀心心

已采纳

刚在那个什么创新医学网上看见过医学论文写作辅导的文章这个知道是不是你要的答案统计资料的显著性检验(significant test)方法的选择是医学论文中常常遇见的问题，退稿原因中常有显著性检验方法选择不当。如t检验、u检验、χ2检验等，虽然各有其应用范围和要求，但也其共同之处。作者可根据统计资料的类型，选择一种或几种检验方法。但当作者在获得一组、两组或两组以上的数据资料时，选择何种显著性检验，是至关重要的问题。不同的资料类型其统计指标、统计检验的方法是不同的，见表1。医学生物研究中，许多指标都是服从正态分布(u分布)的，而随着样本含量加大或自由度增大，t分布、χ2分布、F分布都趋向于正态分布见图1、图2。在《中华创伤杂志》第12卷1～6期和增刊中文章所涉及的统计方法(表2)，表明了正态分布的广泛性、常见性。故当作者获得数据资料后，首先应进行正态性检眩�范ㄊ欠为标准正态分布(或近似正态分布)或不属于正态分布。笔者首先推荐概率单位法。当统计资料属于正态分布或近似正态分布时，差异显著性检验方法的选裕�诜合其应用条件下，一般可按表3进行选择。显著性检验应用时的主要注意事项：(1)率值或均值在进行显著性检验前，应注意样本的代表性和可比性。(2)检验结果接近显著性界限时：要多方面考虑，是否确实不存在差异；或是观察例数不够，而需加大样本例剩换是检验公式运用不当，可用其他检验印证。(3)多个样本比例数的χ2检验，差异显著性，只能说明多组比例数不同或不完全相同，而不能确定哪个比例数不同，要进一步进行显著性检验才能了解两个样本比例数是否构成相同。表1 一般情况下不同资料的统计指标与检验方法的关系资料类型统计指标统计检验方法计量资料均数、标准差 t检验、F检验等计数资料率、构成比 χ2检验等半定量资料率、构成比秩和检验、Ridit分析表2 《中华创伤杂志》第12卷1～6期、增刊显著性检验方法使用频数检验方法应用次数检验方法应用次数 t检验 27 直线相关与回归分析 5 χ2检验 16 拟合线性回归 1 F检验 24 相关分析 6 Q检验 2 非参数统计 4 u检验 1 未注明方法 6表3 常用显著性检验方法的选择统计资料比较类型显著性检验小样本均数与总体均数相比较 t检验小样本均数相比较 t检验、F检验两个或多个大样本均数与总体均数相比较 u检验、t检验大样本均数相比较 u检验、t检验配对计量资料配对t检验两个率的比较 u检验、χ2检验多个样本率的的比较 χ2检验配对计数资料两种属性的相关分析及其差别的比较 χ2检验

254 评论 1小时前发布

常陆院尼美

科学研究很早就已经从简单的定性分析深入到细致的定量分析，科研工作者要面对大量的数据分析问题，科研数据的统计分析结果直接影响着论文的结果分析。在医学科研写作中，实验设计的方法直接决定了数据采取何种统计学方法，因为每种统计方法都要求数据满足一定的前提和假定，所以论文在实验设计的时候，就要考虑到以后将采取哪种数据统计方法更可靠。医学统计方法的错误千差万别，其中最主要的就是统计方法和实验设计不符，造成数据统计结果不可靠。下面，医刊汇编译列举一些常见的可以避免的问题和错误：打开百度APP，查看更多高清图片一、数据统计分析方法使用错误或不当。医学论文中，最常见的此类错误就是实验设计是多组研究，需要对数据使用方差分析的时候，而作者都采用了两样本的均数检验。二、统计方法阐述不清楚。在同一篇医学论文中，不同数据要采取不同统计处理方法，这就需要作者清楚地描述出每个统计值采用的是何种统计学方法，但在许多使用一种以上数据统计分析方法的医学论文中，作者往往只是简单地把论文采用的数据统计方法进行了整体罗列，并没有对每个数据结果分析分别交代具体的统计方法，这就很难让读者确认某一具体结果作者到底采用的是何种数据分析方法。三、统计表和统计图缺失或者重复。统计表或者统计图可以直观地让读者了解统计结果。一个好的统计表或统计图应该具有独立性，即作者即使不看文章内容，也可从统计表或统计图中推断出正确的实验结果。而一些医学论文只是简单地堆砌了大量的统计数字，缺乏直观的统计图或表；或者虽然也列出了统计表或统计图，但表或图内缺项很多，让读者难以从中提取太多有用的信息。另外，也有作者为了增加文章篇幅，同时列出统计表和统计图，造成不必要的浪费和重复。统计表的优点是详细，便于分析研究各类问题。统计图(尤其是条形统计图)的优点是能够直观反映变量的数量差异。医学论文中对数据统计结果的解释，最常见的两个错误就是过度信赖P值(结果可信程度的一个递减指标)和回避阴性结果。前一个错误的原因是因为一些作者对P值含义理解有误，把数据的统计学意义和研究的临床意义混淆。所以医学研究人员一定要注意不能单纯依靠统计值武断地得出一些结论，一定要把统计结果和临床实践结合在一起，这样才会避免出现类似的错误。至于回避阴性结果，只提供阳性结果，是因为不少作者在研究设计时，难以摆脱的一种单向的思维定式就是主观地先认定自己所预想的某种结果结论。在归纳某种结果原因时，从一个方向的实验就下完美的结论，尤其是如果这个结论可能对实际情形非常有意义时。这样的思维定势过于强调统计差异的显著性，有时会刻意回避报道差异的不显著结果，不思考和探究差异不显著的原因和意义，反而会因此忽视一些重大的科学发现。

335 评论 1小时前发布

啾啾啾…

缺失值的处理：缺失值是人群研究中不可避免的问题，其处理方式的差异可能在不同程度上引入偏倚，因此，详细报告数据清理过程中缺失值的处理方法有助于读者对潜在偏倚风险进行评价。例如，瑞舒伐他汀试验在统计分析部分详细说明了缺失值的填补策略，包括：将二分类结局中的缺失值视为未发生事件；将生物标志物和心电图测量中的缺失值进行多重填补（multiple imputation）；为了证明缺失值处理的合理性和填补结果的稳定性，研究还比较了多重填补与完整数据（complete-case）分析的结果。2、数据的预处理：实施统计分析之前往往需要将原始数据进行预处理，如：对连续变量进行函数转换使其更接近正态分布，基于原始数据构建衍生变量，将连续变量拆分为分类变量或将分类变量的不同类别进行合并等。医学论文应报告处理原始数据的方法及依据，瑞舒伐他汀试验即在统计分析部分描述了对血液生物标志物的对数转换。3、变量分布特征描述：确定统计分析使用的变量，并针对每一个变量的分布特征进行描述，是决定研究选用何种统计分析方法的基础。医学期刊虽然普遍对此提出要求，但作者往往套用常用方法，如：连续变量符合正态分布时，采用均数（标准差）描述，否则采用中位数（四分位间距）描述；分类变量采用频数（百分比）描述等。事实上，应根据研究设计类型、统计分析目的和数据特征选择恰当的描述方法。例如，CKB选择采用年龄、性别和地区校正的均值和率来描述人群分布特征，而非简单的报告连续变量的均数和分类变量的构成比。4、主要分析（primary analysis）：指针对研究结局的统计分析，是研究论文的核心证据。因此，医学论文应详细描述主要分析的实施过程和适用性。在试验性研究中，应明确统计分析数据集、试验效应指标、相对或绝对风险及其置信区间的计算方法、以及假设检验的方法。

288 评论 12小时前发布

普陀小吃货

1. 检验有单样本t检验，配对t检验和两样本t检验。单样本t检验：是用样本均数代表的未知总体均数和已知总体均数进行比较，来观察此组样本与总体的差异性。配对t检验：是采用配对设计方法观察以下几种情形，1，两个同质受试对象分别接受两种不同的处理；2,同一受试对象接受两种不同的处理；3，同一受试对象处理前后。 F检验又叫方差齐性检验。在两样本t检验中要用到F检验。从两研究总体中随机抽取样本，要对这两个样本进行比较的时候，首先要判断两总体方差是否相同，即方差齐性。若两总体方差相等，则直接用t检验，若不等，可采用t'检验或变量变换或秩和检验等方法。其中要判断两总体方差是否相等，就可以用F检验。2. t检验和方差分析的前提条件及应用误区用于比较均值的t检验可以分成三类，第一类是针对单组设计定量资料的；第二类是针对配对设计定量资料的；第三类则是针对成组设计定量资料的。后两种设计类型的区别在于事先是否将两组研究对象按照某一个或几个方面的特征相似配成对子。无论哪种类型的t检验，都必须在满足特定的前提条件下应用才是合理的。若是单组设计，必须给出一个标准值或总体均值，同时，提供一组定量的观测结果，应用t检验的前提条件就是该组资料必须服从正态分布；若是配对设计，每对数据的差值必须服从正态分布；若是成组设计，个体之间相互独立，两组资料均取自正态分布的总体，并满足方差齐性。之所以需要这些前提条件，是因为必须在这样的前提下所计算出的t统计量才服从t分布，而t检验正是以t分布作为其理论依据的检验方法。值得注意的是，方差分析与成组设计t检验的前提条件是相同的，即正态性和方差齐性。 t检验是目前医学研究中使用频率最高，医学论文中最常见到的处理定量资料的假设检验方法。t检验得到如此广泛的应用，究其原因，不外乎以下几点：现有的医学期刊多在统计学方面作出了要求，研究结论需要统计学支持；传统的医学统计教学都把t检验作为假设检验的入门方法进行介绍，使之成为广大医学研究人员最熟悉的方法；t检验方法简单，其结果便于解释。简单、熟悉加上外界的要求，促成了t检验的流行。但是，由于某些人对该方法理解得不全面，导致在应用过程中出现不少问题，有些甚至是非常严重的错误，直接影响到结论的可靠性。将这些问题归类，可大致概括为以下两种情况：不考虑t检验的应用前提，对两组的比较一律用t检验；将各种实验设计类型一律视为多个单因素两水平设计，多次用t检验进行均值之间的两两比较。以上两种情况，均不同程度地增加了得出错误结论的风险。而且，在实验因素的个数大于等于2时，无法研究实验因素之间的交互作用的大小。

322 评论 12小时前发布

1982吃货一枚

奇偶校验”。内存中最小的单位是比特，也称为“位”，位有只有两种状态分别以1和0来标示，每8个连续的比特叫做一个字节（byte）。不带奇偶校验的内存每个字节只有8位，如果其某一位存储了错误的值，就会导致其存储的相应数据发生变化，进而导致应用程序发生错误。而奇偶校验就是在每一字节（8位）之外又增加了一位作为错误检测位。在某字节中存储数据之后，在其8个位上存储的数据是固定的，因为位只能有两种状态1或0，假设存储的数据用位标示为1、1、 1、0、0、1、0、1，那么把每个位相加（1＋1＋1＋0＋0＋1＋0＋1＝5），结果是奇数，那么在校验位定义为1，反之为0。当CPU读取存储的数据时，它会再次把前8位中存储的数据相加，计算结果是否与校验位相一致。从而一定程度上能检测出内存错误，奇偶校验只能检测出错误而无法对其进行修正，同时虽然双位同时发生错误的概率相当低，但奇偶校验却无法检测出双位错误。MD5的全称是Message-Digest Algorithm 5，在90年代初由MIT的计算机科学实验室和RSA Data Security Inc 发明，由 MD2/MD3/MD4 发展而来的。MD5的实际应用是对一段Message(字节串)产生fingerprint(指纹)，可以防止被“篡改”。举个例子，天天安全网提供下载的MD5校验值软件，其MD5值是1e07ab3591d25583eff5129293dc98d2，但你下载该软件后计算MD5 发现其值却是81395f50b94bb4891a4ce4ffb6ccf64b，那说明该ZIP已经被他人修改过，那还用不用该软件那你可自己琢磨着看啦。MD5广泛用于加密和解密技术上，在很多操作系统中，用户的密码是以MD5值（或类似的其它算法）的方式保存的，用户Login的时候，系统是把用户输入的密码计算成MD5值，然后再去和系统中保存的MD5值进行比较，来验证该用户的合法性。MD5校验值软件汉化版，使用极其简单，运行该软件后，把需要计算MD5值的文件用鼠标拖到正在处理的框里边，下面将直接显示其MD5值以及所测试的文件名称，可以保留多个文件测试的MD5值，选定所需要复制的MD5值，用CTRL+C就可以复制到其它地方了。参考资料：算法原理及C语言实现－来自（我爱单片机）摘要本文从理论上推导出CRC算法实现原理，给出三种分别适应不同计算机或微控制器硬件环境的C语言程序。读者更能根据本算法原理，用不同的语言编写出独特风格更加实用的CRC计算程序。关键词 CRC 算法 C语言1 引言循环冗余码CRC检验技术广泛应用于测控及通信领域。CRC计算可以靠专用的硬件来实现，但是对于低成本的微控制器系统，在没有硬件支持下实现CRC检验，关键的问题就是如何通过软件来完成CRC计算，也就是CRC算法的问题。这里将提供三种算法，它们稍有不同，一种适用于程序空间十分苛刻但CRC计算速度要求不高的微控制器系统，另一种适用于程序空间较大且CRC计算速度要求较高的计算机或微控制器系统，最后一种是适用于程序空间不太大，且CRC计算速度又不可以太慢的微控制器系统。2 CRC简介CRC 校验的基本思想是利用线性编码理论，在发送端根据要传送的k位二进制码序列，以一定的规则产生一个校验用的监督码（既CRC码）r位，并附在信息后边，构成一个新的二进制码序列数共(k+r)位，最后发送出去。在接收端，则根据信息码和CRC码之间所遵循的规则进行检验，以确定传送中是否出错。16位的CRC码产生的规则是先将要发送的二进制序列数左移16位（既乘以）后，再除以一个多项式，最后所得到的余数既是CRC码，如式（2-1）式所示，其中B(X)表示n位的二进制序列数，G(X)为多项式，Q(X)为整数，R(X)是余数（既CRC码）。（2-1）求CRC 码所采用模2加减运算法则，既是不带进位和借位的按位加减，这种加减运算实际上就是逻辑上的异或运算，加法和减法等价，乘法和除法运算与普通代数式的乘除法运算是一样，符合同样的规律。生成CRC码的多项式如下，其中CRC-16和CRC-CCITT产生16位的CRC码，而CRC-32则产生的是32位的CRC码。本文不讨论32位的CRC算法，有兴趣的朋友可以根据本文的思路自己去推导计算方法。CRC-16：（美国二进制同步系统中采用）CRC-CCITT：（由欧洲CCITT推荐）CRC-32：接收方将接收到的二进制序列数（包括信息码和CRC码）除以多项式，如果余数为0，则说明传输中无错误发生，否则说明传输有误，关于其原理这里不再多述。用软件计算CRC码时，接收方可以将接收到的信息码求CRC码，比较结果和接收到的CRC码是否相同。3 按位计算CRC对于一个二进制序列数可以表示为式(3-1):(3-1)求此二进制序列数的CRC码时，先乘以后（既左移16位），再除以多项式G(X)，所得的余数既是所要求的CRC码。如式(3-2)所示：(3-2)可以设： (3-3)其中为整数，为16位二进制余数。将式(3-3)代入式(3-2)得：(3-4)再设： (3-5)其中为整数，为16位二进制余数，将式(3-5)代入式(3-4)，如上类推，最后得到：(3-6)根据CRC的定义，很显然，十六位二进制数既是我们要求的CRC码。式(3 -5)是编程计算CRC的关键，它说明计算本位后的CRC码等于上一位CRC码乘以2后除以多项式，所得的余数再加上本位值除以多项式所得的余数。由此不难理解下面求CRC码的C语言程序。*ptr指向发送缓冲区的首字节，len是要发送的总字节数，0x1021与多项式有关。[code]unsigned int cal_crc(unsigned char *ptr, unsigned char len) {unsigned char i;unsigned int crc=0;while(len--!=0) {for(i=0x80; i!=0; i/=2) {if((crc&0x8000)!=0) {crc*=2; crc^=0x1021;} /* 余式CRC乘以2再求CRC */else crc*=2;if((*ptr&i)!=0) crc^=0x1021; /* 再加上本位的CRC */}ptr++;}return(crc);}[code]按位计算CRC虽然代码简单，所占用的内存比较少，但其最大的缺点就是一位一位地计算会占用很多的处理器处理时间，尤其在高速通讯的场合，这个缺点更是不可容忍。因此下面再介绍一种按字节查表快速计算CRC的方法。4 按字节计算CRC不难理解，对于一个二进制序列数可以按字节表示为式(4-1)，其中为一个字节(共8位)。(4-1)求此二进制序列数的CRC码时，先乘以后（既左移16位），再除以多项式G(X)，所得的余数既是所要求的CRC码。如式(4-2)所示：（4-2）可以设： (4-3)其中为整数，为16位二进制余数。将式(4-3)代入式(4-2)得：（4-4）因为：（4-5）其中是的高八位，是的低八位。将式（4-5）代入式（4-4），经整理后得：（4-6）再设： (4-7)其中为整数，为16位二进制余数。将式(4-7)代入式(4-6)，如上类推，最后得：(4-很显然，十六位二进制数既是我们要求的CRC码。式(4 -7)是编写按字节计算CRC程序的关键，它说明计算本字节后的CRC码等于上一字节余式CRC码的低8位左移8位后，再加上上一字节CRC右移8位（也既取高8位）和本字节之和后所求得的CRC码，如果我们把8位二进制序列数的CRC全部计算出来，放如一个表里，采用查表法，可以大大提高计算速度。由此不难理解下面按字节求CRC码的C语言程序。*ptr指向发送缓冲区的首字节，len是要发送的总字节数，CRC余式表是按0x11021多项式求出的。[code]unsigned int cal_crc(unsigned char *ptr, unsigned char len) {unsigned int crc;unsigned char da;unsigned int crc_ta[256]={ /* CRC余式表 */0x0000, 0x1021, 0x2042, 0x3063, 0x4084, 0x50a5, 0x60c6, 0x70e7,0x8108, 0x9129, 0xa14a, 0xb16b, 0xc18c, 0xd1ad, 0xe1ce, 0xf1ef,0x 1231, 0x0210, 0x3273, 0x2252, 0x52b5, 0x4294, 0x72f7, 0x62d6,0x9339, 0x8318, 0xb37b, 0xa35a, 0xd3bd, 0xc39c, 0xf3ff, 0xe3de,0x2462, 0x3443, 0x0420, 0x1401, 0x64e6, 0x74c7, 0x44a4, 0x5485,0xa56a, 0xb54b, 0x8528, 0x9509, 0xe5ee, 0xf5cf, 0xc5ac, 0xd58d,0x3653, 0x2672, 0x1611, 0x0630, 0x76d7, 0x66f6, 0x5695, 0x46b4,0xb75b, 0xa77a, 0x9719, 0x8738, 0xf7df, 0xe7fe, 0xd79d, 0xc7bc,0x48c4, 0x58e5, 0x6886, 0x78a7, 0x0840, 0x1861, 0x2802, 0x3823,0xc9cc, 0xd9ed, 0xe98e, 0xf9af, 0x8948, 0x9969, 0xa90a, 0xb92b,0x5af5, 0x4ad4, 0x7ab7, 0x6a96, 0x1a71, 0x0a50, 0x3a33, 0x2a12,0xdbfd, 0xcbdc, 0xfbbf, 0xeb9e, 0x9b79, 0x8b58, 0xbb3b, 0xab1a,0x6ca6, 0x7c87, 0x4ce4, 0x5cc5, 0x2c22, 0x3c03, 0x0c60, 0x1c41,0xedae, 0xfd8f, 0xcdec, 0xddcd, 0xad2a, 0xbd0b, 0x8d68, 0x9d49,0x7e97, 0x6eb6, 0x5ed5, 0x4ef4, 0x3e13, 0x2e32, 0x1e51, 0x0e70,0xff9f, 0xefbe, 0xdfdd, 0xcffc, 0xbf1b, 0xaf3a, 0x9f59, 0x8f78,0x9188, 0x81a9, 0xb1ca, 0xa1eb, 0xd10c, 0xc12d, 0xf14e, 0xe16f,0x1080, 0x00a1, 0x30c2, 0x20e3, 0x5004, 0x4025, 0x7046, 0x6067,0x83b9, 0x9398, 0xa3fb, 0xb3da, 0xc33d, 0xd31c, 0xe37f, 0xf35e,0x02b1, 0x1290, 0x22f3, 0x32d2, 0x4235, 0x5214, 0x6277, 0x7256,0xb5ea, 0xa5cb, 0x95a8, 0x8589, 0xf56e, 0xe54f, 0xd52c, 0xc50d,0x34e2, 0x24c3, 0x14a0, 0x0481, 0x7466, 0x6447, 0x5424, 0x4405,0xa7db, 0xb7fa, 0x8799, 0x97b8, 0xe75f, 0xf77e, 0xc71d, 0xd73c,0x26d3, 0x36f2, 0x0691, 0x16b0, 0x6657, 0x7676, 0x4615, 0x5634,0xd94c, 0xc96d, 0xf90e, 0xe92f, 0x99c8, 0x89e9, 0xb98a, 0xa9ab,0x5844, 0x4865, 0x7806, 0x6827, 0x18c0, 0x08e1, 0x3882, 0x28a3,0xcb7d, 0xdb5c, 0xeb3f, 0xfb1e, 0x8bf9, 0x9bd8, 0xabbb, 0xbb9a,0x4a75, 0x5a54, 0x6a37, 0x7a16, 0x0af1, 0x1ad0, 0x2ab3, 0x3a92,0xfd2e, 0xed0f, 0xdd6c, 0xcd4d, 0xbdaa, 0xad8b, 0x9de8, 0x8dc9,0x7c26, 0x6c07, 0x5c64, 0x4c45, 0x3ca2, 0x2c83, 0x1ce0, 0x0cc1,0xef1f, 0xff3e, 0xcf5d, 0xdf7c, 0xaf9b, 0xbfba, 0x8fd9, 0x9ff8,0x6e17, 0x7e36, 0x4e55, 0x5e74, 0x2e93, 0x3eb2, 0x0ed1, 0x1ef0};crc=0;while(len--!=0) {da=(uchar) (crc/256); /* 以8位二进制数的形式暂存CRC的高8位 */crc<<=8; /* 左移8位，相当于CRC的低8位乘以 */crc^=crc_ta[da^*ptr]; /* 高8位和当前字节相加后再查表求CRC ，再加上以前的CRC */ptr++;}return(crc);}很显然，按字节求CRC时，由于采用了查表法，大大提高了计算速度。但对于广泛运用的8位微处理器，代码空间有限，对于要求256个CRC余式表（共512字节的内存）已经显得捉襟见肘了，但CRC的计算速度又不可以太慢，因此再介绍下面一种按半字节求CRC的算法。5 按半字节计算CRC同样道理，对于一个二进制序列数可以按字节表示为式(5-1)，其中为半个字节(共4位)。(5-1)求此二进制序列数的CRC码时，先乘以后（既左移16位），再除以多项式G(X)，所得的余数既是所要求的CRC码。如式(4-2)所示：（5-2）可以设： (5-3)其中为整数，为16位二进制余数。将式(5-3)代入式(5-2)得：（5-4）因为：（5-5）其中是的高4位，是的低12位。将式（5-5）代入式（5-4），经整理后得：（5-6）再设： (5-7)其中为整数，为16位二进制余数。将式(5-7)代入式(5-6)，如上类推，最后得：(5-很显然，十六位二进制数既是我们要求的CRC码。式(5 -7)是编写按字节计算CRC程序的关键，它说明计算本字节后的CRC码等于上一字节CRC码的低12位左移4位后，再加上上一字节余式CRC右移4位（也既取高4位）和本字节之和后所求得的CRC码，如果我们把4位二进制序列数的CRC全部计算出来，放在一个表里，采用查表法，每个字节算两次（半字节算一次），可以在速度和内存空间取得均衡。由此不难理解下面按半字节求CRC码的C语言程序。*ptr指向发送缓冲区的首字节，len是要发送的总字节数，CRC余式表是按0x11021多项式求出的。unsigned cal_crc(unsigned char *ptr, unsigned char len) {unsigned int crc;unsigned char da;unsigned int crc_ta[16]={ /* CRC余式表 */0x0000,0x1021,0x2042,0x3063,0x4084,0x50a5,0x60c6,0x70e7,0x8108,0x9129,0xa14a,0xb16b,0xc18c,0xd1ad,0xe1ce,0xf1ef,}crc=0;while(len--!=0) {da=((uchar)(crc/256))/16; /* 暂存CRC的高四位 */crc<<=4; /* CRC右移4位，相当于取CRC的低12位）*/crc^=crc_ta[da^(*ptr/16)]; /* CRC的高4位和本字节的前半字节相加后查表计算CRC，然后加上上一次CRC的余数 */da=((uchar)(crc/256))/16; /* 暂存CRC的高4位 */crc<<=4; /* CRC右移4位，相当于CRC的低12位） */crc^=crc_ta[da^(*ptr&0x0f)]; /* CRC的高4位和本字节的后半字节相加后查表计算CRC，然后再加上上一次CRC的余数 */ptr++;}return(crc);}[code]5 结束语以上介绍的三种求CRC的程序，按位求法速度较慢，但占用最小的内存空间；按字节查表求CRC的方法速度较快，但占用较大的内存；按半字节查表求CRC的方法是前两者的均衡，即不会占用太多的内存，同时速度又不至于太慢，比较适合8位小内存的单片机的应用场合。以上所给的C程序可以根据各微处理器编译器的特点作相应的改变，比如把CRC余式表放到程序存储区内等。[/code] hjzgq 回复于：2003-05-15 14:12:51CRC32算法学习笔记以及如何用java实现出自：csdn bootcool 2002年10月19日 23:11 CRC32算法学习笔记以及如何用java实现CRC32算法学习笔记以及如何用java实现一：说明论坛上关于CRC32校验算法的详细介绍不多。前几天偶尔看到Ross N. Williams的文章，总算把CRC32算法的来龙去脉搞清楚了。本来想把原文翻译出来，但是时间参促，只好把自己的一些学习心得写出。这样大家可以更快的了解CRC32的主要思想。由于水平有限，还恳请大家指正。原文可以访问：。二：基本概念及相关介绍2．1 什么是CRC在远距离数据通信中，为确保高效而无差错地传送数据，必须对数据进行校验即差错控制。循环冗余校验CRC(Cyclic Redundancy Check/Code)是对一个传送数据块进行校验，是一种高效的差错控制方法。CRC校验采用多项式编码方法。多项式乘除法运算过程与普通代数多项式的乘除法相同。多项式的加减法运算以2为模，加减时不进，错位，如同逻辑异或运算。2．2 CRC的运算规则CRC加法运算规则：0+0=00+1=11+0=11+1=0 (注意：没有进位)CRC减法运算规则：0-0=00-1=11-0=11-1=0CRC乘法运算规则：0*0=00*1=01*0=01*1=1CRC除法运算规则：1100001010 (注意:我们并不关心商是多少。)_______________10011 1101011011000010011,,.,,....-----,,.,,....10011,.,,....10011,.,,....-----,.,,....00001.,,....00000.,,....-----.,,....00010,,....00000,,....-----,,....00101,....00000,....-----,....01011....00000....-----....10110...10011...-----...01010..00000..-----.. = 余数2．3 如何生成CRC校验码(1) 设G(X)为W阶，在数据块末尾添加W个0，使数据块为M+ W位，则相应的多项式为XrM(X)； (2) 以2为模，用对应于G(X)的位串去除对应于XrM(X)的位串，求得余数位串； (3) 以2为模，从对应于XrM(X)的位串中减去余数位串，结果就是为数据块生成的带足够校验信息的CRC校验码位串。2．4 可能我们会问那如何选择G(x)可以说选择G(x)不是一件很容易的事。一般我们都使用已经被大量的数据，时间检验过的，正确的，高效的，生成多项式。一般有以下这些：16 bits: (16,12,5,0) [X25 standard](16,15,2,0) ["CRC-16"]32 bits: (32,26,23,22,16,12,11,10,8,7,5,4,2,1,0) [Ethernet]三: 如何用软件实现CRC算法现在我们主要问题就是如何实现CRC校验，编码和解码。用硬件实现目前是不可能的，我们主要考虑用软件实现的方法。以下是对作者的原文的翻译：我们假设有一个4 bits的寄存器，通过反复的移位和进行CRC的除法，最终该寄存器中的值就是我们所要求的余数。3 2 1 0 Bits+---+---+---+---+Pop <-- | | | | | <----- Augmented message（已加0扩张的原始数据）+---+---+---+---+1 0 1 1 1 = The Poly(注意: The augmented message is the message followed by W zero bits.)依据这个模型，我们得到了一个最最简单的算法：把register中的值置0.把原始的数据后添加r个 (还有剩余没有处理的数据)Begin把register中的值左移一位，读入一个新的数据并置于register的0 bit的位置。If (如果上一步的左移操作中的移出的一位是1)register = register XOR 现在的register中的值就是我们要求的crc余数。我的学习笔记：可为什么要这样作呢？我们从下面的实例来说明：1100001010_______________10011 1101011011000010011,,.,,....-----,,.,,....－》 10011,.,,....10011,.,,....-----,.,,....－》 00001.,,....00000.,,....-----.,,....00010,,....00000,,....-----,,....00101,....00000,....我们知道G(x)的最高位一定是1，而商1还是商0是由被除数的最高位决定的。而我们并不关心商究竟是多少，我们关心的是余数。例如上例中的G(x)有5 位。我们可以看到每一步作除法运算所得的余数其实就是被除数的最高位后的四位于G(x)的后四位XOR而得到的。那被除数的最高位有什么用呢？我们从打记号的两个不同的余数就知道原因了。当被除数的最高位是1时，商1然后把最高位以后的四位于G(x)的后四位XOR得到余数；如果最高位是0，商0然后把被除数的最高位以后的四位于G(x)的后四位XOR得到余数，而我们发现其实这个余数就是原来被除数最高位以后的四位的值。也就是说如果最高位是0就不需要作XOR的运算了。到这我们总算知道了为什么先前要这样建立模型，而算法的原理也就清楚了。以下是对作者的原文的翻译：可是这样实现的算法却是非常的低效。为了加快它的速度，我们使它一次能处理大于4 bit的数据。也就是我们想要实现的32 bit的CRC校验。我们还是假设有和原来一样的一个4 "bit"的register。不过它的每一位是一个8 bit的字节。3 2 1 0 Bytes+----+----+----+----+Pop <-- | | | | | <----- Augmented message+----+----+----+----+1<------32 bits------> （暗含了一个最高位的“1”）根据同样的原理我们可以得到如下的算法：While (还有剩余没有处理的数据)Begin检查register头字节，并取得它的值求不同偏移处多项式的和register左移一个字节，最右处存入新读入的一个字节把register的值和多项式的和进行XOR运算End我的学习笔记：可是为什么要这样作呢？同样我们还是以一个简单的例子说明问题：假设有这样的一些值：当前register中的值： 010011014 bit应该被移出的值：1011生成多项式为： 101011100Top Register---- --------1011 010011011010 11100 + (CRC XOR)-------------首4 bits 不为0说明没有除尽，要继续除:0001 101011011 01011100 + (CRC XOR)-------------^^^^首4 bits 全0说明不用继续除了。那按照算法的意思作又会有什么样的结果呢？1010 111001 01011100+-------------1011 101111001011 101111001011 01001101+-------------现在我们看到了这样一个事实，那就是这样作的结果和上面的结果是一致的。这也说明了算法中为什么要先把多项式的值按不同的偏移值求和，然后在和 register进行异或运算的原因了。另外我们也可以看到，每一个头字节对应一个值。比如上例中：1011，对应01001101。那么对于 32 bits 的CRC 头字节，依据我们的模型。头8 bit就该有 2^8个，即有256个值与它对应。于是我们可以预先建立一个表然后，编码时只要取出输入数据的头一个字节然后从表中查找对应的值即可。这样就可以大大提高编码的速度了。+----+----+----+----++-----< | | | | | <----- Augmented message| +----+----+----+----+| ^| || XOR| || 0+----+----+----+----+v +----+----+----+----+| +----+----+----+----+| +----+----+----+----+| +----+----+----+----+| +----+----+----+----+| +----+----+----+----++-----> +----+----+----+----++----+----+----+----++----+----+----+----++----+----+----+----++----+----+----+----+255+----+----+----+----+以下是对作者的原文的翻译：上面的算法可以进一步优化为：1：register左移一个字节,从原始数据中读入一个新的字节.2：利用刚从register移出的字节作为下标定位 table 中的一个32位的值3：把这个值XOR到register中。4：如果还有未处理的数据则回到第一步继续执行。用C可以写成这样：r=0;while (len--)r = ((r << | p*++) ^ t[(r >> 24) & 0xFF];可是这一算法是针对已经用0扩展了的原始数据而言的。所以最后还要加入这样的一个循环，把W个0加入原始数据。我的学习笔记：注意不是在预处理时先加入W个0，而是在上面算法描述的循环后加入这样的处理。for (i=0; i> 24) & 0xFF];所以是W/4是因为若有W个0，因为我们以字节（8位）为单位的，所以是W/4个0 字节。注意不是循环w/8次以下是对作者的原文的翻译：1：对于尾部的w/4个0字节，事实上它们的作用只是确保所有的原始数据都已被送入register，并且被算法处理。2：如果register中的初始值是0，那么开始的4次循环，作用只是把原始数据的头4个字节送入寄存器。（这要结合table表的生成来看）。就算 register的初始值不是0，开始的4次循环也只是把原始数据的头4个字节把它们和register的一些常量XOR，然后送入register中。3A xor B) xor C = A xor (B xor C)总上所述，原来的算法可以改为:+-----+----+----+----+----++----+----+----+----++----+----+----+----++----+----+----+----++----+----+----+----+255+----+----+----+----+算法：1：register左移一个字节,从原始数据中读入一个新的字节.2：利用刚从register移出的字节和读入的新字节XOR从而产生定位下标，从table中取得相应的值。3：把该值XOR到register中4：如果还有未处理的数据则回到第一步继续执行。我的学习笔记：对这一算法我还是不太清楚，或许和XOR的性质有关，恳请大家指出为什么？谢谢。到这，我们对CRC32的算法原理和思想已经基本搞清了。下章，我想着重根据算法思想用java语言实现。 hjzgq 回复于：2003-05-15 14:14:51数学算法一向都是密码加密的核心，但在一般的软路加密中，它似乎并不太为人们所关心，因为大多数时候软体加密本身实现的都是一种编程上的技巧。但近几年来随著序列号加密程序的普及，数学算法在软体加密中的比重似乎是越来越大了。我们先来看看在网路上大行其道的序列号加密的工作原理。当用户从网路上下载某个Shareware -- 共享软体后，一般都有使用时间上的限制，当过了共享软体的试用期后，你必须到这个软体的公司去注册后方能继续使用。注册过程一般是用户把自己的私人信息（一般主要指名字）连同信用卡号码告诉给软体公司，软体公司会根据用户的信息计算出一个序列码出来，在用户得到这个序列码后，按照注册需要的步骤在软体中输入注册信息和注册码，其注册信息的合法性由软体验证通过后，软体就会取消掉本身的各种限制。这种加密实现起来比较简单，不需要额外的成本，用户购买也非常方便，在网上的软体80%都是以这种方式来保护的。我们可以注意到软体验证序列号的合法性过程，其实就是验证用户名与序列号之间的换算关系是否正确的过程。其验证最基本的有两种，一种是按用户输入的姓名来生成注册码，再同用户输入的注册码相比较，公式表示如下：序列号 = F(用户名称)

342 评论 12小时前发布

医学论文常用的数据校验

5个回答 默认排序 默认排序 按时间排序

相关问答

医学论文

向你推荐

热门问题

5个回答默认排序

默认排序

按时间排序