Skip to main content

核酸报告统计汇总表(含OCR截图识别)

由于学校疫情防控需要,为便利核酸报告收集工作,人工微结构科学与技术协同创新中心eScience中心与计算机科学与技术系的团队合作,依托中心的计算资源制作了含截图识别的表格模板系统。

表格包含功能有:

  • 表单收集苏康码内核酸截图,自动识别并关联人员信息
  • 计算指定时间段内核酸完成情况,包括完成率以及未完成名单

使用本模板,需要进行一些基本配置才能发挥完整功能。

一、使用模板

进入table.nju.edu.cn,访问模板

模板内找到 “健康-核酸报告统计汇总表(含OCR截图识别)” 后开始使用。

二、表格配置

由于模板的限制,暂时自动化任务无法通过模板复制,而自动化任务是整个模板的核心。因此,这一部分非常重要

第一步:导入人员名单

在表格使用前,需要预先准备一个以下格式的名单:

学工号 姓名
100001 张三
…… ……

人员信息汇总表中,选择从xlsx或csv中导入新数据,然后选中符合格式的文件:

**注意!Excel表格需要把单元格格式全部改为文本类型,否则部分纯数字学工号会出现异常!**确认无误后导入。

导入后,应当是只有学工号姓名列有信息,而且没有多余空行

第二步:设置自动化任务

在表格右上角,更多 “...”-自动化规则,点击 “增加规则”

之后会进入具体自动化规则的设置页面。

这里需要同样的方法新建两个规则,具体设置见下:

① 自动触发OCR识别

此自动化是为了当有人提交截图时,自动开始OCR识别。设置如下:

项目 设置
规则名称 (随意)
表格 原始数据
视图 默认视图
触发条件 新增记录
操作 运行Python脚本
脚本 请求OCR识别核酸报告

② 自动链接人员信息

此设置是为了有新的识别结果时,自动链接人员信息。设置如下:

项目 设置
规则名称 (随意)
表格 已识别核酸记录
视图 默认视图
触发条件 新增记录
操作 添加链接
选择此表中的链接列 链接人员信息
列1 学工号
列2 学工号

第三步:发放表单(问卷)

点击右上方表单:

鼠标移至已有的表单处,点击分享按钮,将此链接分享给他人即可填写(为了获取身份,表单默认会要求登录)。

填写者的界面,学号姓名也会自动识别,仅需上传一个截图

特别需要注意,如果发放对象为学生等在Table服务范围的用户,姓名学号是可以自动识别的,但是需要编辑表单打开仅登录用户

三、子表设计功能介绍

模板中分为四个子表,每张表格都设计有具体功能。四张子表分别为:

  • 原始数据:所有表单填写提交的数据均会提交到此处
  • 已识别核酸记录:被图像识别处理后的数据(学工号、姓名、核酸检测时间)会自动生成在此处
  • 时间段分析汇总表:根据选择时间段自动计算核酸报告完成情况(完成率、未完成名单)
  • 人员信息汇总表:存放全部人员的信息(学工号、姓名)

通过适当的自动化逻辑设计,我们可以让表格完成如下的流程:

  1. 收集对象(如学生)填写表单,只需要提交一张苏康码内的核酸检测截图;截图提交后,会出现在 “原始数据” 子表
  2. “原始数据” 子表检测到新增信息,自动触发OCR识别脚本,脚本识别是否和提交人一致,并识别出截图中含有的核酸检测信息,汇总在 “已识别核酸记录” 子表
  3. “已识别核酸记录” 子表识别到新增信息,与 “人员信息汇总表” 中的人员信息匹配并建立双向链接;同时 “人员信息汇总表” 中会显示最近一次核酸检测的时间
  4. 通过 “时间段分析汇总表” ,手动选择开始日期和结束日期,点击按钮便可自动计算该段时间内的核酸检测完成率,以及生成一个未完成人员的名单

原始数据

自动模式

原始数据表单一般不需要任何操作,自动化设置完毕后会自动处理,并且提供结果。

手动模式

但是如果出现无法识别或识别失败的情况,原始数据内包含一个重新识别按钮,直接点击会调用脚本自动识别。

切换到无法识别视图,会将没有识别或识别失败的内容单独显示。

已识别核酸记录

自动模式

这张表一般不需要操作,在原始数据内识别的结果,会自动添加到这里,并与人员信息汇总表的人员信息关联。

手动模式

但是如果出现前面原始数据无法识别,需要手动在这一张表添加链接,并填写姓名链接学生信息

然后在运行工具栏-“...”-数据处理-匹配人员数据处理,即可自动匹配手动新加的人员记录。

之后将人工介入处理的条目,直接将状态修改为已人工处理以标记处理完成。

时间段分析汇总表

这个页面仅支持手动模式,通过设置日期范围,点击计算完成情况会在后面自动生成结果。

人员信息汇总表

此表无需额外操作,仅仅用于查看相关人员最近一次的核酸时间。

鸣谢

校党委研工部

计算机科学与技术系研究生工作办公室

技术支持

IMAGINE Lab实验室、计算机软件研究所、自然语言处理研究组

OCR模块开发

硕士研究生王甲豪、张天昀和吕云哲(计算机科学与技术系研究生会)

模板设计

硕士研究生王甲豪、张天昀和吕云哲(计算机科学与技术系研究生会)

人工微结构科学与技术协同创新中心

计算资源

人工微结构科学与技术协同创新中心


如遇使用问题,欢迎加入QQ群:2343870

相关推文👉NJU计小妍:抗疫|核酸检测自动核查系统出炉~

NJU计小妍:

微结构eScience: