为完成全文检索相关功能集成工作,南宁市国家档案馆拟对该项工作进行采购,现将信息发布如下:
一、项目基本情况
项目名称:南宁市国家档案馆全文检索相关功能集成项目。
采购方式:询价。
预算金额:31.5万元。
最高限价:与预算金额一致。
采购需求:详见本启事第二项项目采购需求。
合同履行期限:合同签订之日起3个月内完成所有服务内容。
本项目(是/否)接受联合体:否。
二、项目采购需求
(一)OFD版式阅读软件
功能描述:对符合国家版式标准的OFD格式的版式文档进行阅读和编辑处理;产品支持对版式文件快速打开阅读、保存、打印、检索、导航、电子签章、各类注释处理、安全处理等功能。
技术指标:
1.无需安装插件或者客户端程序,即可以打开本地或者服务端OFD文件,快速阅读;并提供用于业务系统调用的API接口。
2.服务模式下支持版式文档在服务端进行分段解析处理,支持非加密文档、加密文档打开阅览,支持在线输入密码解密,保证传输过程的可靠和安全。
3.支持OFD/PDF文档的打开、保存、另存、搜索、打印、阅读、页面旋转、缩放以及全屏显示、自动缩放、翻页、页面跳转等功能。
4.支持OFD文件内容进行检索并高亮显示。
5.具有签章查验功能。
6.支持用户自定义元数据、标引、附件、多文件、多版本等查看功能。
(二)OFD版式处理套件
功能描述:符合 OFD 版式文档格式标准及电子公文应用领域的相关标准规范。提供OFD标准格式转换,支持版式文件包含PDF、图像文件、HTML/TXT、OFFICE等统一转换为OFD版式文件,同样支持OFD另存为PDF、图像以及TXT文本。
技术指标:
1.支持将常见文档格式如OFFICE、WPS、图片、RTF、HTML、TXT、PDF等格式转换为OFD格式;支持OFD档案组合拆分功能,支持OFFICE、WPS、OFD、PDF、图片等格式转换后组合成一个OFD文件,也可将多页的OFD档案拆分成多个单页的OFD文件。
2.支持PDF、TXT等文件同OFD互转。
3.支持图片与OFD互转同时可自定义分辨率以控制文件体积和质量,支持OFD文档图片压缩。
4.支持基于OCR识别技术生成双层OFD/PDF文档。
5.支持多文件有序拼接转换为OFD文件;支持对转换后OFD文件自动添加页码并设置相对位置。
6.支持水印、文件内容权限控制、文件加解密、插入/删除页、旋转、交换页面、添加或者获取元数据、添加附件以及集成第三方电子签章等功能。
7.支持对转换的文档添加掩膜,可设置掩膜区域的大小和所需添加掩膜的文档页码。
8.支持模板设计信息设计样式的输入,其中信息输入包括文字、图片、图形、二维码、表格、语义标引等信息。
9.支持高级转换服务,可将流式文件中的大纲、书签、链接等文档元素带到OFD文档中,并保持内容活性。
10.支持套转服务,结合业务数据叠加模板文件套转生成OFD文件,满足业务系统中各种套打功能和报表的版式化需求。
11.支持在OFD档案上添加归档章,支持签章验证。
(三)OCR文字识别软件
功能描述:实现JPG、JPEG或PDF格式纸质档案数字化成果中文字内容的识别与提取,并将其转换为OFD/PDF文档便于电子文档后续的检索利用。
技术指标:
1.支持常见的主流操作系统与平台,如Windows10、WindowsServer、Ubuntu等;支持国产化操作系统,包括银河麒麟、中标麒麟、UOS等;兼容多种硬件平台,可运行于X86、ARM、MIPS、LoongArch64等硬件平台之上。
2.支持SDK集成,支持JAVA、C#调用方式、支持CPU与GPU模式。
3.通过集成SDK完成1个/多个文档合并为双层形式的OFD/PDF版式文件,既可以100%保留原始版面效果,又便于文档的内容检索。同时在生成过程中可附加元数据以及附件。
4.支持输入1个/多个文档并提取文字内容,可输出文字为文本文件、xml、json等格式。
5.支持宋体、仿宋、黑体、楷体等几十种常见字体;支持简体、繁体、英文,并可扩展训练其它语言。
6.印刷体扫描文档图像识别率达99%;支持CPU模式,服务器无需配置GPU亦可完成识别。
7.可从图片、OFD、PDF等文件中提取文字并生成双层OFD或PDF文件。
(四)全文检索
功能描述:支持电子档案的检索、筛选和输出,能够为利用者提供符合国家标准格式的电子档案。
技术指标:
1.提供全方位检索手段,包括外部特征与正文内容的各种逻辑组合检索、位置检索、二次检索、渐进检索、模糊检索、历史检索、大小写敏感检索、对检索结果按与检索表达式的相关性程度排序等。实现精确计算,报告准确的检索记录数。
.支持对检索结果的各种排序:基于文章内容与检索表达式的相关度计算的相关性排序;基于一个或多个特征属性的字段排序。
3.支持检索结果的统计和浏览。
4.提供动态索引,能够实时提供检索服务,原子更新,可添加、删除、修改和增加已存在文档的字段值,无需再次传送整个文档。提供近乎实时的操作和 NoSQL 特性,如realtime-get,乐观锁和持续更新。
5.支持按词索引、按字索引和字词混合索引。即适应不同应用环境的需求。
(五)系统集成
功能描述:OFD版式阅读软件、OFD版式处理套件、OCR文字识别软件、全文检索与现有和拟建的业务系统进行无缝集成。
技术指标:
1.在合同履行期限内将OFD版式阅读软件、OFD版式处理套件、OCR文字识别软件、全文检索与现有的业务系统做对接,集成到现有的南宁市电子文件(档案)备份中心系统。
2.成交供应商应当书面承诺:在合同履行期限后三年内将OFD版式阅读软件、OFD版式处理套件、OCR文字识别软件(不包含全文检索软件)以迁移的方式集成到拟建的南宁市集约化数字档案馆室一体化平台系统。
3.提供用户手册和SDK兼容性说明(如哪个版本的C#、JAVA等)
4.检索响应时间应当小于10秒。
文章推荐:
福建梅花山国家级自然保护区基础设施建设项目-管理站监控中心项目竞争性磋商公告
【招标公告】福建梅花山国家级自然保护区基础设施建设项目-管理站监控中心项目