对远程数据传输中数据规范的分析
摘 要:对远程数据传输的数据规范进行分析,提出参数存储属性的概念,达到数据传输与数据接收、应用分离的目的,使多系统数据共用成为可能。
关键词:远程;数据传输;数据规范;参数代码;存储属性
远程数据传输是指"通过网络技术把钻井施工中的工程信息、泥浆气测信息、地质信息和地化信息等井场有关资料传回基地进行网络发布"的技术,该项技术被我国各大油田广泛应用,特别是随着在该项技术上发展的多个专家系统(多井对比系统、综合事故预报系统、快速综合解释系统、水平井导向系统等)的应用,使得该项技术在油田勘探、开发中的作用越来越大、越来越重要,所以多个软件厂家都提出了远程数据传输的方案,多个设备供应商也都在设备供应中提供了远程数据服务。可以说远程数据技术百花齐放、多家争鸣,但现在存在一个致命的缺点,那就是某一公司开发的数据传输软件不能被其它公司的软件系统和设备应用,别的公司开发的专家系统也不能在我的数据传输平台上应用,致使许多雷同的系统不得不频繁的多次开发,不得不对数据传输格式、数据传输序列、传输方法进行多次开会修订、发布,这种情况不但浪费了大量的人力物力,还影响了技术的开发、推广速度和应用范围及应用效果。怎么解决这个问题呢?
为了解决多个系统数据共用的问题,我们必须对传输数据进行规范、进行分类,对传输方式方法进行统一,对数据接收处理、同步、转发进行规范,制定一套全方位的数据规范。但这一数据规范能适应快速发展的需要吗?能解决所有系统数据共享共用的问题吗?
远程数据传输技术从传输的角度分实时传输部分和定时传输部分,其中实时传输部分是指每分钟每秒钟都在传输的工程施工信息,主要包括工程各种参数(如:井深、钻时、钻速、大钩负荷、悬重、钻盘转速、扭矩、泵冲、泵压、立管压力等)和气测泥浆参数(如:泥浆出入口温度、泥浆出入口密度、泥浆出入口电导率、气体全量、气体组分等);其中定时传输部分是指工况信息、部分地质资料、地化信息等)。
远程数据传输技术的核心是传输、接收和应用,其中传输指的就是待传数据的提取、组织。由于数据源的不同,提取数据的方式也是多种多样,只要提取的数据准确,快捷就可以,这里不做具体介绍。这里主要介绍数据的组织,首先要把待传数据组成一条信息即一条记录,这条记录要具有记录的起始字段、属性字段、信息字段、结束标记,如下图:
起始字段 | 属性字段1 | 属性字段···n | 数据信息··· | 结束标记 |
其中属性字段1到属性字段n代表的是整个记录的属性,其中必须包括记录长度、传输属性、加密属性、参数数量、接收属性等信息。根据实际情况,记录可以采取定长和动态两种方式。传输属性应该包括(实时、定时、首次、修改、追加)等信息。接收属性应该包括数据存放方式、地点、转发的信息。数据信息是传输的中心,它应该包括多个信息字段,并且这些多个字段中至少有一个索引字段(如时间、工程井深、迟到井深等),其中每个数据字段的又应用该包含(数据字段名、数据属性、数据内容)等信息。
综合记录属性字段、数据信息字段(数据字段名、数据属性、数据内容)对数据进行组织,有以下几种组织方式:
1、明码记录:这种记录的记录长度不固定,数据内容如不加密则是文本信息,数据信息字段结构简单,每一个参数后面跟随一个数据,这种方式组织明了,接收整理也方便,形成的数据流举例如下:起始字段、索引字段1(井名)、索引字段2(时间)、加密属性(无)、存储属性(实时库)、数据信息(井名-实际值、时间-实际值、井深-实际值、······、钻压-实际值、扭矩-实际值)、结束标志。这种方式除起始字段和结束标志外,其它参数项可以按一定规律或变化等元因随机组织,该记录没用数据提示较多,加大数据传输的负担,并且必须统一数据提示标志,如数据提示标志发生异常,则很难处理。
2、属性编码记录:这种记录就是把明码记录的字段提示变成编码提示,这就需要传输组织端和接收处理端使用代码提示,如井名的代码在编码中为200,则明码记录中的井名已经在组织时变成了200,形成的数据流举例如下:起始字段,(100、具体井名),(102,具体时间),(190,0),(195, 实时库),(200,具体井名),(201,具体时间),(202,具体井深),·····,(204,钻压实际值),(217,扭矩实际值),结束标志。这种方式与明码记录区别就是使用了属性编码,记录长度有所减少,但数据组织与数据接收处理必须使用属性编码。
3、定长定位编码记录:这种记录就是把记录的大小、参数的位置、记录的属性全部用编码表示,记录组织、传输、接收、处理的信息全部在记录属性编码里,由于记录的属性并不多,所以一般不用记录属性编码字典文件,而是直接蕴含在程序的条件选择里,这种方式是现在用的最多的一种,形成的数据流举例如下:起始字段,具体井名,具体时间,0,实时库,具体井名,具体时间,具体井深,·····,钻压实际值,扭矩实际值,结束标志。这种方式固定了记录的长度,不适于参数的加减,由于没有编码引领,参数实际代表意义很不明确,但这种方式记录短小,接收处理固化,不适用于其它系统的调用,这是造成各种专家系统不能兼容的关键。
4、单参数索引记录:这种记录就是把每个参数的一次变化形成一个编码记录,记录组织、传输以单一参数变化为基础,接收、处理的信息以索引为基础,这样能形成单一参数传输记录,该记录便于传输和接收,具有较大的共享行和可处理性。具体形成的数据流如下:起始字段、加密属性、具体井名、索引字段编码、索引字段值、参数代码、参数具体值、结束标志。这样形成的记录特别便于接收和接收后的处理,特别对于地质资料、地化资料的传输接收有明显优势。举例说明如下:
例1:起始字段、0、查44井、101、2157.32、204、150、结束标志。查找代码表,101为工程井深,204为钻压,那么上个记录的意义就是"查44井2157.32米的钻压为150KN,根据代码表属性把其存入工程井深库。
例2:起始字段、0、查44井、103、2154.00、408、'灰黑色泥质粉砂岩'、结束标志。查找代码表,103为迟到井深,408为岩性,那么上个记录的意义就是"查44井2154.00米的岩性为'灰黑色泥质粉砂岩',根据代码表属性把其存入迟到井深库。
这
里我们提到一个代码表存储属性,代码存储属性是接收端根据接收参数的属性独立编制的,它与传输端无关,这样就决定了接收与发送的独立性。
这几种记录的数据接收、处理是有明显区别的,其中明码记录、属性编码记录、定长定位编码记录的接收和处理是由存储属性决定的,存储属性在发送时已经确定,它的数据长短、参数多少、参数编排序列都已确定,这种确定就决定了接收端的固定性,也就是说只有自己的接收软件才可以接收,这就极大地限制了接收数据的应用,使应用范围局限在接收软件允许的范围内。
单参数索引记录的参数存储是由代码存储属性决定的,而代码存储属性是由接收系统特性决定的,自己的接收系统把接收到的数据存储到自己的某个数据表里,这样就把接收数据与发送数据的固化模式打破,可以轻松应用其它系统的传输数据,达到多家软件公司数据共享应用的难题。例如:"综合事故预报系统"接收的泥浆参数存放在自己的时间数据库里,以便于自己对工程事故预报的实时性;"快速综合解释系统"又会把泥浆参数存放在自己迟到井深数据库里,便于自己快速解释评价底层;而"水平井导向系统"会把其遗弃而不存储。
单参数索引记录的参数存储属性可以是单一的,根据需要也可以编制复合型的,如:可以把参数钻时的存储属性定义为工程整米数据库和迟到井深数据库,这样接收软件就会把接收到的钻时信息存储到程整米数据库和迟到井深数据库。
单参数索引记录的灵活接收存储的方法还必须与发送端使用统一编码表,在统一编码表的基础上制定自己的存储代码属性而已,各系统根据自己的代码存储属性进行存储,而不必影响其它系统,这种代码属性的独立应用是系统达到数据共用的目的。
为了保障数据的安全性,每个记录都预留了数据加密属性,根据数据加密属性的约定,传输端给待传数据加密,接收端根据数据加密属性对数据进行解密。加密属性可以不包含在每条记录里,该属性可以提前到接收端第一次申请连接时,在某一连接接入后直接解析出加密属性,这一加密属性就一直延续使用,直到该传输连接掉线或人为干预其从新启动重连。加密属性是应用方为了保障传输数据的安全性设立的,它可以是传输端与发送端事先预约好的,也可以是使用方自己根据需要设定的特殊方法函数,也可以是事先约定与用户设定相结合。数据加密属性仅对系统使用方负责,使用方根据自己的需要设定独立的加密函数。程序设计方在程序完成后已经不清楚使用方采取的加密属性,这样能保障数据的安全性。
总之,在数据安全的前提下,根据数据使用控制方的安全授权,使用上文提到的"单参数索引记录"数据规范方法,可以很容易地达到多系统的数据共享应用,避免了雷同专家系统的重复开发,能有效地解决数据规范的制定和数据共享应用的问题。
参考文献:
[1]国家知识产权局专家编写组。《数据传输电路制作方法,加工技术》,知识产权出版社,2011。
[2] 邬宽明。《单片机外围器件实用手册数据传输接口通道》,北京航空航天大学出版社,2005。
上一篇:电力企业引入ERP系统的研究分析
下一篇:MPEG-1声音压缩与MP3