基于ArchBank技术的井史数字化应用
摘 要:摘要:本论文结合中石油信息化建设持续深化的实际情况,提出了井史数字化的应用前景及价值。论述了井史资料数字化应用实现方法。旨在建立实用的井史数据库结构,形成结构化和非结构化数据库,在统一的管理平台上进行科学的组织、分类和管理,并通过有效的手段发布分享,使之成为群体知识和共享成果,实现井史资料收藏数字化、操作电脑化、传递网络化、信息存贮自由化和资源共享化。
关键词:关键词:井史 ;数字化 ;应用
中图分类号:TP39 文献标识码:A 文章编号:
1.前言
随着油田开发不断深入,生产管理信息化进程也不断的深入和完善,目前有大量非结构化历史档案资料尚未电子化。通过对井史纸质资料电子化,以及井基础数据、作业数据、管柱数据、抽油杆数据、压裂成果数据的结构化整理来为专业应用提供数据。研究人员可以基于专业数据查询平台(ArchBank系统)进行数据综合分析,为研究人员的专业应用提供可量化的数据支持,同时为各级领导和相关部门提供可量化的决策依据。开创油田技术档案数字化应用先河。
2.井史资料电子化的实现内容
2.1井史资料电子化
对83556口开发井在1960年至2000年产生的纸质资料和约2000口勘探井的纸质资料折合A4幅面约146万页(折算比例为:A4:A3 =1:4,A4:A0=1:20)进行扫描、编辑、集成、添加水印、编写书签等一系列的工作,最终形成清晰的PDF电子文档成果,电子成果达到技术指标为:电子文档命名遵照分公司井史资料存档规范;井史报告扫描分辨率在200dpi以上,附图扫描分辨率在300dpi以上;图像处理端正、清晰、无明显杂点,图片大小一致;标签依据原始资料添加。
2.2部分数据结构化
依据数据库结构,通过对数据源分析、录入、自校、校对、审核、入库六个环节把1990-2000年约9.3万条井史数据从井史报告中采录、校对、审核、建库,成果数据达到的技术指标为:实现与用户在用数据库对接,数据表的关键字准确率100%。
3.井史资料电子化实现方法
3.1井史资料电子化工作流程
整理流程一般包括借阅、整理、分发、扫描、转换、校对/检查、审核、验收、入库、归还等环节,其中,不同类型的资料及存储介质在扫描、转换、校对/检查两个环节上是不同的。下图是资料整理的工作流程。
图1 资料整理工作流程
3.1.1扫描
按照《纸质档案数字化技术规范》(DA/T31-2005)要求,一般资料采用200dpi灰度方式扫描即可,针对含有很多非常小的文本或脚标(小六号或更小)根据实际情况调高分辨率,以保障资料的清晰度。由于文件长度按分辨率的平方大幅度增长的,所以需要有针对性的选择。
对于绝大多数的图件(如A0图),要求最低300dpi分辨率,对于部分图件需要提高分辨率到400dpi左右,但针对图幅过宽、过长等特殊图件,由于扫描生成文件过大,导致无法正常浏览,只能在保证图元正确显示的基础上,适当降低像素值。所有扫描成果要求保证1∶1打印效果清晰。
3.1.2图片编辑
采取相应技术措施确保图像质量。主要工作包括图文纠编、去黑边、去噪声、任意旋转、影像增强等。编辑处理的图片效果用以下几个图片来对比展示。
图2资料拼接效果图对比图
3.1.3图片校对
数据资源建设项目的成败取决与成品质量,为了确保成品质量,项目采用多年积累的三级质量控制措施进行质量控制,分别是录入阶段录入自校,通过后由独立的校对人员进行校对,最后再由专业人员审核。
图片校对重点关注以下四方面:
图片分辨率
确认目的:确认页面清晰度;
确认方式:利用Photoshop软件RGB方式打开JPG文件,图像菜单图像大小选项读取分辨率数据;
确认指标:页面分辨率不小于200dpi或比对不低于原文件的清晰度视为该项指标合格。
档案资料还原程度
确认目的:扫描形成的电子文件的清晰度应最大限度地接近(等同于)原件,扫描内容要完整。凡原件中可识别的内容(污迹除外),在PDF文件的打印结果和屏幕显示结果中应亦可识别;
确认方式:进行1∶1打印后与原件进行对比;
确认指标:符合档案的原貌视为该项指标合格。
图像内容整洁
确认目的:保证图像的美观与整洁度;
确认方式:用ACDSee看图软件将图片放大至150%,上下移动检查是否有黑边、污迹、折痕等无信息价值的图元存在;
确认指标:页面整洁,背景色适中,并无黑边、污迹、折痕等无信息价值的图元存在视为该项指标合格。
页面纠偏
确认目的:资料页面端正;
确认方式:使用Photoshop软件RGB方式打开确认文件,视图菜单水平和垂直参考线,与文件内容比较;
确认指标:页面的纠偏倾斜度不超过±0.5度视为该项指标合格。
漏页、多页或重页
确认目的:确认PDF文件的完整性;
确认方式:与原文件逐页对照;
确认指标:无漏页、多页或重页的现象视为该项指标合格。
3.1.4书签著录
参照有关标准,并结合原文目录结构及实际章节结构,采用人工方式进行书签著录,即提取目录建立索引,使生成的PDF文件形成一本浏览方便的电子书。
3.1.5添加水印
为了保护资料的所有权,在生成PDF文件的同时,增加分公司标志的静态水印标记。参数如下:
• 外观旋转:45°
• 不透明度:11%
• 水印文件相对于目标页面比例:100%
• 位置:在页面中心
• 显示要求:打印时显示,浏览时不显示
3.1.6专家审核
专家审核是内部三级质量控制中的最后一个环节。审核采用抽查的方式,比例不小于百分之三十。最终成果对照纸质档案资料逐页审核,检查有无漏页、多页或重页现象。页面分辨率不小于200dpi或比对不低于原文件的清晰度。形成的电子文件的清晰度应最大限度地接近(等同于)原件,且内容要完整。逐个检查PDF书签与内容是否匹配。审核元数据内容是否正确、规范。
经抽检审核不合格的资料,成批次返还相应岗位进行整改,重新按整理流程进行处理。
4.井史数字化系统的应用前景及价值(结论)
4.1数字井下、数字油田的需要
油田井史档案“进机”是我们的夙愿!地质大队现存油田勘探开发井史资料近十万口(卷、册),这些资料是油田开发50年来几代石油人的心血和汗水的结晶,是油田弥足珍贵的技术财富。井史档案数字化是一个运用现代科技手段的数字资源系统工程,涉及到信息资源加工、存储、传输、检索和利用的全过程,是信息基础建设的重要组成部分。
4.2档案工作的需要
目前油田开发设计编制人员在编制设计时,需靠手工查询纸张原件。
由于档案量巨大,数据分类信息复杂,查询档案需花费几个小时的时间查找、抄写,耗时、耗力;其次档案需长期保存,为提高存储环境,避免可能造成文档纸张受潮、虫蚀以及火灾等情况发生,每年投入大量的文档保管经费已在所难免,且因无备份而又为每年不得不有的文档损失担忧;由于档案需反复查阅,不可避免的存在原件受损或遗失,给文档的保管与利用带来管理上的困扰。因此,为帮助油田开发分析人员进行高效的信息查询、确保档案资料长期安全保存,我们在将历史档案资料信息化方面努力做些应用尝试。
4.3实现井史档案信息化管理和网络共享
井史资料电子化有利于对油田科学认识的有效积累和应用,从长远来说,也是分公司发展的重要推动力。
参考资料:
[1] 毛军等著,数据库原理及应用。1997年7月 重庆大学出版社
[2] 何嘉荪著,办公自动化系统与电子档案管理。2003年1月 浙江大学出版社
[3] 王萍著,电子档案著录标准及其应用。2010年1月 吉林大学出版社
[4] 美国 Kevin Loney 等著 Oracle 9i The complete Reference 2003年7月 机械工业出版社
上一篇:计算机虚拟化技术应用分析