软云AI档案数字化平台应用场景

XX省户籍档案著录

 
项目基本情况:XX户籍整理项目,涉及到常住人口登记表、户口迁移证、准予迁入证明,户口审查核准材料,户籍证明材料等十几种材料,图片数量1500万张,时间跨度从上个世纪80年代至2020年,甲方要求比较严格,要求每一张图片均需要多条著录。

困难和挑战:在这1500万张图片里面,填表内容为手写的占了70%,且字迹潦草,由于档案材料内容横跨40多年,同样的材料类型也有多种样式,很难采用固定模板或预训练的方式进行OCR著录。假设采用框选OCR辅助的方式,单人一天极限情况下也仅能完成500页的著录工作,整体著录工作量为2.8万人天,人工成本360万元。

软云AI自动著录:为加速完成工作进度,采用了三套软件并发运行的方式,每天24000页的户籍著录工作,相当于48人的工作量,且识别效果超过人工著录的准确度。后期仅仅需要10人的团队进行质检即可按期完成质检交付工作。

XX省XX厅文书档案整理

 
项目基本情况:XX省XX厅文书档案整理项目,共有文书档案10000件。根据甲方的要求,需要按照年份,处室分类,然后根据三合一制度进行归档排序。

困难和挑战:该厅下属处室有16个,每个处室对保管期限的规则均不相同。为了能够按时交付,需要聘请三位有多年文书档案处理经验的实施经理驻场进行保障,但由于实施方有多个档案项目在多地同时进行,人员保障问题成为了突出问题。

软云AI文书自动著录:实施团队采用了软云的AI档案数字化平台,在不需要阅读文书内容的情况下,将文书档案按照自然排序,100件一组分成不同的组。在扫描分件后,由平台进行自动著录,自动判定保管期限、责任人,提取时间,人物,并自动拟定题名。在平台内,完成质检工作后,导出Excel,完成后续工作。

XX省档案馆民清档案整理

 
项目基本情况:XX省档案馆有清代和民国档案共380万页,内容以清代奏折、奏章、公文、民国公文为主。主要工作是通过高拍仪拍照后,进行图片的裁剪后,进行题名等著录工作。

困难与挑战:首先是拍照后的图片裁剪,大量的清代奏折是多折,需要逐一裁剪,需要人工在纠偏以后,通过框选的方式来进行处理。由于甲方对图像质量要求严格,需要在保证图像的完整性的前提下,留边要维持在2毫米左右。根据此要求,即使是最熟练的修图工作人员,一天也仅能完成1000张。另外一个挑战是要招募大量汉语言文学专业毕业,且能熟练阅读竖版繁体字的工作人员,完成题名、人物、日期、受文者的著录工作,每天能够处理80-100件的著录工作。按照这些要求,修图需要3800人天,著录需要8000人天。

软云AI自动著录:软云AI档案数字化平台提供了AI辅助识图功能,修图人员只需要将鼠标悬浮在图片目标区域,点击确认后,平台会自动纠偏并切图,不需要借助和切换至其他修图软件,单日能完成5000图片的裁剪工作,修图人力成本为原来的20%。古文的自动题名著录工作采用了双套软件并发运行,但是可完成6000件著录工作,相当于60人的工作量。

XX公司人事档案整理

 
项目基本情况:XX公司人事档案有大约1000员工的9000件人事档案,需要按照员工编号进行整理,按照人事档案分类标准排序,并标注类别编码和类内码。

困难和挑战:人事档案整理最为费时的是需要阅读档案进行排序。传统的做法是首先逐一阅读文档,按照员工首字母分类,完成后再对每一个字母分类中的文档再次分类,直到每一个员工的档案材料聚拢在一起,之后再次阅读文档,判定人事档案类别和时间顺序,并填写编码和类内码。此工作完成后,扫描上传,进行著录工作。

软云AI自动著录:在不需要阅读人事档案材料的情况下,,将人事档案按照自然排序,100件一组分成不同的组。在扫描分件后,由平台进行自动著录,判定类别、姓名、日期,并自拟题名。质检完成后,导出Excel,填写类内码,并找到对应文件归集,填写编码和类内码。平台会自动完成对已扫描图片的编码和类内码,页码的生成工作。

联系我们

业务合作:廖经理 13237004125