融合认知计算场景化应用和发展建议_数字经济

融合认知计算场景化应用和发展建议

最近风靡一时的ChatGPT是以大数据、大模型、大算力为特征的人工智能技术，而由我国企业(中润普达公司)自主研发的融合认知计算作为推进人工智能认知能力提升的核心技术之一却是以小数据、小模型、小算力为特征，是以构建中文语义的分词矩阵来探索处理复杂数据的新方法、新技术。该技术已在场景应用中体现出明显的价值。

发布时间：2023-05-22 13:42 来源：数字经济杂志作者：张智祥王楚涵张耀龙

一、“融合认知计算”在认知智能发展中的作用

在当今时代，机器智能在感知智能和计算智能等方面已经达到甚至超越了人类水平。但是，人工智能技术在应用于不同行业时，经常面临着专业数据和知识匮乏等难题。因此，在标注样本较少的情况下，如何运用深度学习技术以实现更佳的认知效果，成为了一个重要问题。多模态数据融合认知技术可以在此方面发挥重要作用。

具体说来主要有三方面的作用:首先，通过融合多来源多模态数据，可以解决数据智能过程中盲人摸象的问题。其次，自然语言处理如果在一个新领域缺乏足够的数据，将会面临冷启动的问题。在这种情况下，需要通过积累人的经验和知识，完成对业务的理解和认知，实现认知启动。最后，在有限的数据条件下，可以通过预训练和学习大量知识，并将其融入到语言模型中，再结合具体场景，同样可以达到非常好的预期效果。

融合认知计算的创新主要有以下几个方面：智能系统设计，例如人工智能系统、机器学习系统等，使这些系统能够更好地模拟人类认知过程，提高其智能水平和适应；改善人机交互体验，例如通过人机交互的方式来优化计算机系统的响应速度、准确性等方面的性能，从而提高人们的工作效率和用户体验;研究人类认知过程，例如使用计算机模型来模拟和分析人类认知过程，揭示认知的规律和机制；语言与文本处理，例如通过自然语言处理、语音识别等技术，使计算机能够更好地理解人类语言和文本，从而实现智能翻译、问答系统、文本分类等应用；智能辅助决策，例如通过建立智能决策支持系统，对大量数据进行处理和分析，提供有效的决策建议，帮助人们做出更明智的决策。

二、“融合认知计算”场景化应用

多源多模态数据融合认知计算已经在气象、保险、能源、招商、诊疗等行业均得到了应用,该技术通过对不同行业数据的语义特征集成和投影到共享的语义子空间中，从而建立起数据融合认知语义网络模型，实现产业多源(多模态)数据的融合认知分析计算，目前已走向场景化应用，为智慧产业赋能。

场景化应用一，融合气象数据的商业新零售。以某一城市或者地区某一年的气象要素包括气温变化、天气变化、季节变化等数据以及其变化值作为自变量，以商品类别数据(包括名称与型号等)以及历史销售(包括销售时间、销售规模、销售数量、销售价格等)数据等作为反应的变量，将各类原始数据标准化后，建立变量的相关系数矩阵，通过建立多元线性回归决策树模型，实现与公开发布的气象预报数据匹配和计算，解决现有技术中人工预测商业零售效率低且预测结果不准确的问题，完成商业零售的智能预测，为制定营销策略、商品流通储备等提供了有效的决策参考。

场景化应用二：现阶段无人驾驶汽车仍然没有实现长距离行驶，因为目前无法对前方道路可能存在的危险进行预测，更无法针对相应的路况做出行驶状态的改变，也无法防止因路况变化而导致的安全事故。引入融合认知计算后将气象数据与道路数据、车辆数据等相融合，开发出的面向无人驾驶的道路危险认知系统，解决了上述问题。同时通过GIS、卫星、雷达等多源气象数据和多维交通路面状态气象模型，融合高速公路气象站实况数据和交通路况数据，建立起气象与高速公路数据融合认知语义网络模型，打造精准交通气象系统，可以提前对恶劣天气进行预警并且对不同灾害气象状态下的行驶风险、车道、车流管控措施提出管控建议，便于交通管理部门提前预警并开展有效救援，控制交通运行的安全风险。

场景化应用三：城市产业大脑建设。

城市发展与产业布局密不可分。目前越来越多的城市重视产业大脑建设，这一项目中大量采用融合认知计算技术。比如城市大脑中产业链招商，可以采集园区和企业多来源、多维度数据，并将获取的源数据根据来源分别建立园区文本数据集和企业文本数据集并进行预处理，通过利用余弦相似度算法，匹配计算园区意愿语义信息与企业意愿语义信息，将与企业意愿语义信息相似度高于预设第二阈值的园区意愿语义信息作为有效招商线索主题。实现企业意愿与园区招商信息精准匹配，为企业筛选排查出吻合度高的产业链招商线索主题，实现招商线索的精准发现，也就是所谓的“精准招商”。

场景化应用四：车辆融合计算保险服务。通过获取待投保车辆的VIN码和违章数据并融合，从包括国际国内保险市场数据和同行业保险公司数据中获取对应的赔付率数据以及赔付案例数据，整合全国3000多种保单数据信息，进行处理，利用融合逻辑回归的Adaboost算法构建赔付率预测模型。通过资源对接整合人脸三维数据、运营商要素数据、车辆VIN码数据、行驶证核验数据、驾驶证核验数据、车辆违章数据、车辆维保数据等多源人车数据信息，通过融合认知计算预测模型，建立合理的车险定价体系。

场景化应用五：发热疾病智能鉴别诊断和认知计算。发热是十分常见的临床症状。引起发热的疾病很多，发热的原因也很复杂，所以对于发热疾病的鉴别诊断比较困难。现有的发热疾病智能辅助诊疗系统主要通过特征信息选择方法来实现。在特征信息中小规模的情况下，这种方法能够有效地识别出一阶关键特征信息。但是，当发热疾病多模态数据的特征之间呈现出超高维特性时，现有的特征选择方法很难有效地从海量的特征信息集合中识别相互紧密相关的特征子集。发热疾病多模态特征融合认知计算方法主要采用非线性核显式展开方式对发热疾病特征信息数据进行展开表示，获得组合式高阶特征信息，并从中识别出关系最为紧密的高阶特征信息子集，通过充分挖掘特征之间的高阶依赖关系，解决发热疾病多模态数据的特征信息之间的关联关系，充分利用发热疾病各模态中的特征信息进行智能分类和学习，可以有效地提升发热疾病智能鉴别诊断和认知计算的准确率。

三、“融合认知计算”发展建议

(一)加强数据共享流通与交易步伐目前，我国的数据共享程度还非常有限。虽然有的城市已经有了数据开放条例，但不同机构、不同部门的数据，需要垂直管理，所以还谈不上实现共享。针对数据流转共享过程中一系列瓶颈因素，需要通过设计共享、访问制度，制定保障数据可迁移和互操作性的规则，推动数据要素和资源流转，促进价值倍增和数字经济发展。同时，需要探索建立平台间的有效连接，提高数据互操作性，并建立开放生态系统。应鼓励其跨平台、跨公共和商业领域共享，促进全社会的数据要素资源流通和价值倍增。

(二)加强语义认知研究和融合计算研究

语言是认知的窗口，对语言有处理能力是人工智能的一种高级表现形式。计算语言学是跨学科的研究领域，其目标是找出自然语言的规律，建立计算模型，最终让计算机能够像人类一样理解并处理自然语言。语义理解需要获取丰富的、灵活的语义表示，同时与场景知识融合，解决“认知冰山”问题。人工智能需要引入自然语言理解、认知语言学、心理语言学、社会语言学等多学科的综合参与，建立起以计算机为载体，以语言理解为突破，以多源感知数据为手段，以多源多模态数据融合认知计算技术为方法，实现人机交互，为多源数据赋能。

所以，未来应该从认知的视角来研究计算语言学,特别是中文语义认知问题，加强中文语义的认知研究和融合计算分析研究，国家科技主管部门应该支持具备一定研究基础的企业成立“融合认知实验室”，也可以推动校企合作，增强科研能力。

(三)推动融合认知计算场景化应用

在大数据时代，数据来源不仅包括传统纸质数据如资料和书籍，还包括互联网数据如百科、网页新闻和多媒体，以及许多专业领域的数据如电磁、雷达和通信数据。这些数据呈现出多种类型和内容，包括数据库、文本、声音、图像和视频等，且多源异构数据呈现出结构化、半结构化和非结构化的交叉并存现象。结构化数据和非结构化数据的混杂导致了知识挖掘和存储方面的困难，同时数据时效性的变化也给新旧知识的应用带来了挑战。

融合认知计算为上述问题的解决找到了方向，并且在诸如城市产业大脑建设、健康管理、智慧诊疗、智能驾驶、智慧农业等方面得到初步应用，行业主管部门应积极引导，在政策、资金、市场等方面给予必要的支持。

(四)加强认知计算方面人才的培养数字经济需要的人才主要分为数字化专业人才和数字化应用人才，其中计算产业人才是最短缺的门类之一。当前，多模态认知计算研究已从学术牵引转化为需求牵引，在图像、视频、文本、语音等海量多模态数据和强大的算力支撑下，国内外各大知名企业与研究机构纷纷加入此项研究中，计算人才短缺问题突出。

在解决人才短缺问题时，不仅需要培养更多的人才，还需要建立合理的人才生态系统，平衡长期规划和短期需求，需要优化产业人才基石，建设高质量教育体系，打造一支既覆盖“塔尖”的人才，也要兼顾“塔基”的人才的优秀的人才梯队，用“认知计算思维”培养未来人才，把语言学相关的课程，融入到计算机课程体系中。建立校企合作协同育人机制，充分满足深化工程教育改革和产教融合的发展需求。(文︱张智祥全国科技振兴城市经济研究会副秘书长、科技金融专委会主任王楚涵北京师范大学-香港浸会大学联合国际学院助理导师张耀龙亚马逊软件工程师)

关键词阅读:

融合认知计算

融合认知计算场景化应用和发展建议

每日必读

专题 访谈

2022(第五届)行业信息化技术创新发展峰会

“赛道转换时代信创启迪未来”2022(第五届...[详细]