4

最佳实践|杉岩MOS双引擎助力某动力学科研机构智能化档案管理

 3 years ago
source link: http://www.dostor.com/p/73580.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
最佳实践|杉岩MOS双引擎助力某动力学科研机构智能化档案管理-存储在线
当前位置:存储在线 > 新闻 > 正文

一、动力学研究——航空航天取得成功的理论基石

2021年3月26日,国家航天局发布2幅由我国首次火星探测任务天问一号探测器拍摄的南、北半球火星侧身影像,这无疑是我国深空探测成果的一个缩影。自2020年7月23日成功发射以来,天问一号探测器已累计飞行两百余天,为后续着陆和巡视探测奠定了良好的基础。这一切的背后,离不开科研人员的持续攻关,而相关的动力学研究便是重要的攻关领域之一。

某动力学科研机构是为适应中国航空航天事业发展需要而组建的,迄今为止已圆满完成大量航空航天飞行器相关的科研任务,获得国家级和部委级科技进步奖千余项。作为国内动力学研究的核心力量,几十年来,机构科研人员默默坚守,逐一攻克该领域发展中的层层阻碍,为我国迈向科技强国做出了突出贡献。

二、档案管理的新要求:数字化 合规化 智能化

该机构积攒了大量的历史档案资料,绝大部分是以非结构化数据存储的电子文档,包括纸质档案扫描件、录音、录像等。目前所采用的传统IT架构在海量档案存储管理面前显得捉襟见肘。

海量小文件存储

目前档案扫描件数量超过1亿,当录入文件数达到2000万,原有的集中式存储便已出现明显性能瓶颈,影响数据读取和备份效率。后续总文件数预计超过5亿,传统存储显然无法支撑。

档案数据智能处理

由于档案扫描件多是PDF格式,信息检索查阅不便。比如:科研人员想要基于文献内容查阅历史资料就很难实现。因此,该机构要求存储能够对扫描件进行内容提取,进而支持基于内容的检索,提升效率。

全生命周期管理

按照合规要求,档案需长期甚至永久保存,因此要制定生命周期管理策略,让档案数据在在线库、近线库和离线库间自动迁移。而目前无论是原有存储本身还是档案管理系统都没有考虑此问题。

跨部门档案收集

该机构档案资料分散在不同下属机构,以往是通过移动硬盘拷贝到传统存储中,效率低且存在安全风险。

为了满足上述需求,客户最终选择杉岩MOS海量对象存储替换原有传统存储,实现IT基础架构的演进升级。

三、基于MOS构建海量档案智能存储管理平台

MOS支撑海量存储与便捷管理

该平台基于多台杉岩对象存储一体机构建百TB级对象存储资源池,满足百亿级小文件存储和高效访问的需求,为该机构提供统一的非结构化数据存储和管理平台,并通过生命周期管理策略、智能数据处理引擎等实现电子化档案的集中存储、全局管理、智能处理和自动运维。

截屏2021-01-28 下午3.56.48

图1.基于MOS构建海量档案智能管理平台

MOS智能数据处理引擎带来效益加成

值得一提的是,MOS独有的智能数据处理引擎在该方案为客户带来了极大价值。前述讲到,档案扫描件多是以单层的PDF文件形式进行存储,业务端无法基于PDF中的文字内容进行检索,查阅资料十分不便。

通过MOS智能数据处理引擎集成的OCR识别插件,客户可以根据需要设定文件处理策略,存储自动调用OCR识别功能,将单层PDF文件(文字不可读取)转为双层PDF文件(文字可读取),然后基于文字内容通过检索引擎建立全文索引,方便快速检索查阅,充分发挥档案资料的知识价值。

截屏2021-01-28 下午3.56.31

图2.MOS智能数据处理引擎实现档案数据智能处理

四、客户价值

集合海量存储核心引擎和智能数据处理引擎,MOS海量对象存储为客户带来显著价值。

安全合规:海量数据永久保存

MOS承载包括纸质档案扫描件、视频、图片在内的多种类型数据,分布式架构支撑海量小文件高效存取和未来扩展性,满足永久保存的合规性要求。

简化管理:集中存储与全局管理

基于MOS构建统一的存储和管理平台,实现全局档案自动化管理,避免了单独拷贝带来的安全风险,同时简化了运维。

效率提升:智能处理助力科研提效

通过智能数据处理引擎,存储自身实现档案数据处理,配合检索工具,科研人员能够快速获取所需档案资料,一定程度上提升了科研效率,让档案的知识价值最大化。

该项目基于MOS构建的智能存储管理平台,不仅解决了客户海量文件读写慢、共享管理难的痛点问题,同时,也证明了MOS智能数据处理引擎在数据价值利用方面的效益加成,是传统IT基础架构向新型分布式智能基础架构演进的成功实践。


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK