公共卫生教职工入校名单(OCR识别)
由于学校疫情防控需要,为便利教职工入校名单收集工作,人工微结构科学与技术协同创新中心eScience中心与计算机科学与技术系的团队合作,依托中心的计算资源制作了含截图识别的表格模板系统。
表格包含功能有:
- 表单收集入校教职工信息和行程卡截图
- 自动识别行程卡截图时间、手机号码、途径城市、是否带有星号
使用本模板,需要进行一些基本配置才能发挥完整功能。
一、使用模板
进入table.nju.edu.cn
,访问模板。
在模板内找到 “健康-公共卫生教职工入校名单(OCR识别)” ,点击打开并使用模板。
二、表格配置
由于模板的限制,暂时自动化任务无法通过模板复制,而自动化任务是整个模板的核心。因此,这一部分非常重要。
1. 自动触发OCR识别
在表格右上角,更多 “...”-自动化规则,点击 “增加规则”
之后会进入具体自动化规则的设置页面。
此自动化是为了当有人提交截图时,自动开始OCR识别。设置如下:
项目 | 设置 |
---|---|
规则名称 | (随意) |
表格 | 入校申请 |
视图 | 默认视图 |
触发条件 | 新增记录 |
操作 | 运行Python脚本 |
脚本 | 请求OCR识别行程卡 |
2. 发放表单
针对教职工发放传统表单(问卷)可以收集行程码。点击右上方表单:
注:若教职工包含自管人员,访问权限请不要开启“仅登录用户”,应设置为 “任何人”。
3. 发放查询外部应用
在表格右上方的插件-外部应用内,添加外部应用,选择数据查询,名称可以设定为入校查询。
设置查询字段为入校教职工工号,因为是公开查询链接,为了隐私保护隐藏全部字段,然后再打开必要的且可公开的字段,如准许入校状态、工号和姓名,设置完成后将此查询共享外链分发:
填写者点开的查询界面如下:
输入工号即可查询允许入校的情况。
三、视图设计功能介绍
模板唯一的子表中分为三个视图,每个视图都是为特定目的设计。分别为:
- 默认视图:所有表单填写提交的数据均会提交到此处,被图像识别处理后的数据(时间、手机号、途经城市等)会自动生成在此处
- 异常行程:行程卡识别不成功、带星号、非当日截图,会在此处显示
- 准许入校名单:在默认视图中点击允许入校后的名单在这里,可以导出Excel后直接在信息收集系统中导入
默认视图
提交的记录会在云端自动识别,如果出现识别不成功的情况,可以通过重新识别按钮来再次尝试识别。
在识别成功后,根据识别结果,手动点击允许入校按钮,会给此提交添加 “允许” 的标记;反之,可以双击空白将“准许入校状态”改为不允许,
异常行程
异常行程会单独将行程码识别结果有异常的条目单独列出,以供处理。
准许入校名单
所有被标记 “允许” 的条目均会在此简化显示,
你只需要使用 “导出视图为Excel”,便可以导出符合格式的Excel文件直接导入信息收集系统中上报!
四、人员名单
通过导入本单位所有人员的信息,可以进行已提交记录的自动匹配,从而确认每人是否已提交以及手机号码是否匹配
-
在表格“人员名单”中导入本单位所有人员的工号、姓名和手机号
-
在已有的自动化规则中再新增一个动作: |项目|设置| |-|-| |操作|添加链接| |选择此表中的链接列|人员名单| |如果列|入校教职工工号| |列|工号|
鸣谢
校党委研工部
计算机科学与技术系研究生工作办公室
技术支持
IMAGINE Lab实验室、计算机软件研究所、自然语言处理研究组
OCR模块开发
硕士研究生王甲豪、张天昀和吕云哲(计算机科学与技术系研究生会)
模板设计
硕士研究生王甲豪、张天昀和吕云哲(计算机科学与技术系研究生会)
人工微结构科学与技术协同创新中心
计算资源
人工微结构科学与技术协同创新中心
如遇使用问题,欢迎加入QQ群:2343870。
NJU计小妍:
微结构eScience: