摘要:
本发明公开了一种基于三元组神经网络的物种生物学分类方法及系统。该方法包括:获取待分类序列,所述待分类序列为DNA序列、RNA序列、氨基酸序列、基因组数据序列、转录组数据序列、宏基因组数据序列或宏转录组数据序列;确定所述待分类序列的k‑tuple频度向量;采用神经网络模型对所述待分类序列的k‑tuple频度向量进行降维处理;基于降维后的k‑tuple频度向量分别计算所述待分类序列与各类样本序列之间的距离;将与所述待分类序列距离最近的类别确定为所述待分类序列的类别。本发明具有数据预处理简单、分类速度快的特点。