Skip to main content

核酸报告统计汇总表(含OCR截图识别)

由于学校疫情防控需要,为便利核酸报告收集工作,eScience中心与计算机科学与技术系的团队合作,依托中心的计算资源制作了含截图识别的表格模板。

表格包含功能有:

  • 表单收集苏康码内核酸截图,自动识别并关联人员信息
  • 计算指定时间段内核酸完成情况,包括完成率以及未完成名单

使用本模板,需要进行一些基本配置才能发挥完整功能。

一、使用模板

进入table.nju.edu.cn,访问模板

模板内找到 “健康-核酸报告统计汇总表(含OCR截图识别)” 后开始使用。

二、表格配置

由于模板的限制,暂时自动化任务无法通过模板复制,而自动化任务是整个模板的核心。因此,这一部分非常重要

第一步:导入人员名单

在表格使用前,需要预先准备一个以下格式的名单:

学工号 姓名
100001 张三
…… ……

人员信息汇总表中,选择从xlsx或csv中导入新数据,然后选中符合格式的文件:

确认无误后导入。

导入后,应当是只有学工号姓名列有信息,而且没有多余空行

第二步:设置自动化任务

在表格右上角,更多 “...”-自动化规则,点击 “增加规则”

之后会进入具体自动化规则的设置页面。

这里需要同样的方法新建两个规则,具体设置见下:

① 自动触发OCR识别

此自动化是为了当有人提交截图时,自动开始OCR识别。设置如下:

项目 设置
规则名称 (随意)
表格 原始数据
视图 默认视图
触发条件 新增记录
操作 运行Python脚本
脚本 请求OCR识别核酸报告

② 自动链接人员信息

此设置是为了有新的识别结果时,自动链接人员信息。设置如下:

项目 设置
规则名称 (随意)
表格 已识别核酸记录
视图 默认视图
触发条件 新增记录
操作 添加链接
选择此表中的链接列 链接学生信息
列1 学工号
列2 学工号

第三步:发放表单(问卷)

点击右上方表单:

鼠标移至已有的表单处,点击分享按钮,将此链接分享给他人即可填写(为了获取身份,默认会要求登录)。

三、子表设计功能介绍

模板中分为四个子表,每张表格都设计有具体功能。四张子表分别为:

  • 原始数据:所有表单填写提交的数据均会提交到此处
  • 已识别核酸记录:被图像识别处理后的数据(学工号、姓名、核酸检测时间)会自动生成在此处
  • 时间段分析汇总表:根据选择时间段自动计算核酸报告完成情况(完成率、未完成名单)
  • 人员信息汇总表:存放全部人员的信息(学工号、姓名)

通过适当的自动化逻辑设计,我们可以让表格完成如下的流程:

  1. 收集对象(如学生)填写表单,只需要提交一张苏康码内的核酸检测截图;截图提交后,会出现在 “原始数据” 子表
  2. “原始数据” 子表检测到新增信息,自动触发OCR识别脚本,脚本识别是否和提交人一致,并识别出截图中含有的核酸检测信息,汇总在 “已识别核酸记录” 子表
  3. “已识别核酸记录” 子表识别到新增信息,与 “人员信息汇总表” 中的人员信息匹配并建立双向链接;同时 “人员信息汇总表” 中会显示最近一次核酸检测的时间
  4. 通过 “时间段分析汇总表” ,手动选择开始日期和结束日期,点击按钮便可自动计算该段时间内的核酸检测完成率,以及生成一个未完成人员的名单