使用说明
1 引言

由于第二代测序(next generation sequencing,NGS)的高敏感性,其在诊断肺部感染病原体中的应用愈加普及。但是NGS在报告样本中病原体时更易受到污染的影响,并且无法区分定植菌和致病菌,这限制了NGS的可解读性。当临床工作人员遇到NGS报道的物种而无法确定其是否是致病菌时,常根据临床经验和既往关于此物种致病的报道进行判断。对于物种致病的报道常通过PubMed检索进行,但是PubMed检索常常包含很多非临床相关文献导致无法对此物种致病的报道数量直观快速的了解,且临床工作人员逐篇阅读文献需要花费大量的时间。为了给NGS报告和解读临床致病细菌时提供便捷快速的参考,中日医院曹彬团队借助神经网络Bert模型筛选了PubMed中报道肺部致病菌的文章并建立了肺部致病菌数据库,其中包含了PubMed中描述细菌导致的肺部感染的文献信息(包括文献的题目、摘要、原文链接、文献中患者的信息、标本来源)。本软件为基于肺部致病菌数据库的搜索工具。

1.1 编写目的

本文档为使用说明文档,描述了软件的原理、功能、运行要求和使用的方法。本软件面向的使用对象为测序公司的报告人员、呼吸科及检验科的临床医生、科研人员。

1.2 参考资料

[1]Lee J, Yoon W, Kim S, et al. BioBERT: a pre-trained biomedical language representation model for biomedical text mining. Bioinformatics. 2020;36(4):1234-1240. doi:10.1093/bioinformatics/btz682 [2]Rasmy L, Xiang Y, Xie Z, Tao C, Zhi D. Med-BERT: pretrained contextualized embeddings on large-scale structured electronic health records for disease prediction. NPJ Digit Med. 2021;4(1):86. Published 2021 May 20. doi:10.1038/s41746-021-00455-y

2 软件概述

2.1 软件用途

本软件主要开发语言为Python和JavaScript,数据库采用的是Mysql。可以实现对呼吸道病原菌搜索,以及通过物种名称、患者的人数、性别、年龄、证据等级、免疫状态的排序和筛选。

3 运行环境

3.1 硬件要求

3.2 软件要求

4 使用说明

4.1 运行步骤

1.如图4-1所示,在“中国肺炎研究”官方网站首页(https://www.chinapneumonia.cn/)在上方选择“病原检索”(位置如图4-1中①所示)进入病原检索页面。

图 4-1 进入检索页面

2.如图4-2所示,进入病原检索页面后,在中部的搜索栏中输入目标细菌名称,支持中文或英文名称,且搜索栏支持联想功能,可以通过输入部分细菌名称以获得联想的细菌名称。①处提供了帮助链接,包含了此工具的使用说明书。

图 4-2 搜索致病菌

3.图4-3显示了搜索后的结果页面。显示了搜索后的结果页面。①显示了报道此细菌为呼吸道病原菌的文献的数量。②处为排序选项,可以以“物种英文名称”、“物种中文名称”,患者的“样本量”、“年龄”、“免疫状态”、“证据等级”(检测病原菌所用的样本类型),文献的“发表日期”进行排序。③处为筛选选项,点击此处可以显示筛选栏④,可以按照患者的 “性别”、“样本量”、“年龄”、“免疫状态”、“证据等级”和文献的“发表日期”进行筛选。⑤处显示了一篇文献的信息,包含了文中患者的“性别”、“样本量”、“年龄”、“免疫状态”、“证据等级”,文献的“标注方式”、“发表日期”、“原文链接”的信息。

图4-3 搜索结果

4.2 结果解释

每条搜索结果为一篇报道了搜索细菌为呼吸道病原菌的文献的信息概要。包括了细菌信息(英文名称、中文名称),患者的基本信息(样本量、性别、年龄、免疫状态)、证据等级、标注方式、文献信息(原文链接和发表日期)。如果细菌被判断为呼吸道病原菌,则其“是否病原菌群”结果为“yes”,否则为“no”。患者样本量被分为“1”、“1-10”、“11-100”、“100以上”及“none”(表示未获取相关信息);患者年龄被分为“1岁以下”、“1-17岁”、“18-65岁”、“65岁以上”及“none”(表示未获取相关信息);患者免疫状态包括“正常”、“抑制”及“none”(表示未获取相关信息),符合以下的任一条件,便被定义为免疫受损:(1)患有血液癌或实体肿瘤及接受化疗者;(2)因血液癌/骨髓移植/固体器官移植而进行免疫抑制治疗;(4)慢性类固醇使用;(5) 患有艾滋病;(6) 再生障碍性贫血等其他导致免疫细胞数量或功能缺陷的血液类疾病;(7)无脾(8) 其他免疫功能不全(任何免疫功能不全状态,包括先天性/遗传免疫不妥协);证据等级是基于微生物学和病理学评价判断细菌是否为呼吸道病原菌的标准,表3-1列举了证据等级的分类标准。标注方式包括 “人工标注”和“模型标注”,“人工标注”表示此文献中的细菌是否为呼吸道病原菌由人类标注者确定,“模型标注”表示此文献中的细菌是否为呼吸道病原菌由神经网络模型确定。

4.3 注意事项

为了高通量且全面地检索文献,同时由于文献全文无法批量获取,因此我们仅通过文献的摘要判断目标细菌是否为呼吸道病原菌,这可能导致部分信息的缺失。另外,本数据库尚未纳入报道病毒与真菌在呼吸道致病的文献,计划将来补充相应数据。

表4-1 证据等级分类标准