人工智能助力情报分析的理论与应用综述
在信息爆炸的时代,情报分析作为国家安全、经济决策和科学研究的核心工具,其重要性不断提升。随着人工智能和大模型技术的飞速发展,情报分析的理论基础、方法论和实际应用正发生深刻变革。本文综述了情报分析的主要范式、流程、在军事领域的应用,以及人工智能(包括自然语言处理、机器学习、知识图谱、大语言模型、多模态技术等)在情报分析中的关键作用,探讨了大模型推动情报分析智能化的前景。
目录
4.1 自然语言处理(Natural Language Processing,NLP)
4.2 机器学习(Machine Learning,ML)和深度学习(Deep Learning,DL)
前言
在当今信息爆炸的时代,情报分析作为国家安全、经济决策和科学研究的重要工具,其重要性日益凸显。情报分析是整个情报工作流程的中心环节,正是情报分析驱动了情报工作流程。随着人工智能技术的飞速发展,大模型的应用为情报分析带来了革命性的变化。本文旨在综述人工智能助力情报分析的理论基础、方法论以及实际应用,探讨大模型在这一领域的革新与前景。
情报分析(Intelligence Analysis)是对获取的信息进行分析,得出有用情报的过程。它是“情报过程”的重要组成部分,涉及信息的分解、合成和逻辑推理,以得出有价值的结论。情报分析通过现代信息技术和软科学研究方法,对信息进行采集、选择、评价、分析和综合,形成更有用的情报产品,为科学决策提供支持。随着互联网的普及,情报分析越来越注重网络情报的获取,通常采用计算机海量信息过滤和人工分析相结合的模式。情报分析在社会重大决策中发挥关键作用,其关注的重点是数据采集、处理、分析及深层次挖掘,探索从复杂数据中发现知识关联的方法。
关于情报分析方面的理论研究,学者们大多关注新技术环境对情报分析范式和情报分析流程等的影响。
1 情报分析范式
在当今信息化和全球化的背景下,情报分析已经成为各类组织和机构在决策过程中不可或缺的重要环节。情报分析不仅仅是对现有信息的整理和解读,更是通过多种方法和工具,将分散的、未处理的数据转化为具有战略价值的情报信息。根据不同的需求和情境,情报分析可以采用多种范式,每种范式在数据处理、分析方法和应用领域上各有侧重。本文将介绍四种主要的情报分析范式——数据驱动的情报分析范式、模型驱动的情报分析范式、专家驱动的情报分析范式以及混合驱动的情报分析范式。这些范式不仅展示了情报分析的多样性和复杂性,更揭示了如何通过科学的方法和策略,提升情报分析的效率和准确性,为决策提供强有力的支持。
1.1数据驱动的情报分析范式
数据驱动的情报分析范式侧重于利用大量数据进行情报提取和分析。该方法依赖于大数据技术,通过收集、清洗和处理多源数据,如社交媒体、传感器数据、政府公开数据和新闻报道等。数据驱动的情报分析通常包括以下步骤:
-
数据收集:从各种数据源收集相关信息,确保数据的广泛性和多样性。
-
数据处理:清洗和整理数据,处理缺失值和噪音数据,确保数据的质量和一致性。
-
数据分析:使用统计分析、机器学习和数据挖掘技术,从数据中提取有价值的信息和模式
-
情报生成:将分析结果转化为可操作的情报,为决策提供支持。
这种范式适用于需要处理大量数据且数据来源复杂的情报分析任务,如市场趋势分析、社会动向监测和危机预警。
1.2 模型驱动的情报分析范式
模型驱动的情报分析范式通过构建和使用数学模型或计算机模型来理解和预测复杂系统的行为。该方法通常包括以下步骤:
-
模型构建:基于理论和经验知识构建数学模型或计算机模型,描述系统的关键要素和它们之间的关系。
-
模型校准:使用历史数据和实验数据校准模型参数,确保模型能够准确反映现实情况。
-
模拟与预测:利用模型进行模拟和预测,评估不同情境下系统的行为和结果。
-
情报应用:将模型预测结果应用于实际决策过程,为政策制定、风险管理和战略规划提供支持。
这种范式适用于需要预测未来情境和评估不同策略影响的情报分析任务,如经济预测、环境监测和军事战略分析。
1.3 专家驱动的情报分析范式
专家驱动的情报分析范式依赖于领域专家的知识和经验,通过专家判断和定性分析进行情报生成。该方法通常包括以下步骤:
-
问题定义:明确情报分析的具体问题和目标,确定需要分析的关键因素和变量。
-
专家咨询:召集领域专家进行讨论,收集专家意见和判断,形成初步分析框架。
-
定性分析:根据专家意见进行定性分析,识别关键趋势、风险和机遇。
-
情报生成:整合专家观点和定性分析结果,生成可操作的情报报告和建议。
这种范式适用于数据有限或需要高度专业知识的情报分析任务,如政治风险分析、行业前景预测和战略咨询。
1.4 混合驱动的情报分析范式
混合驱动的情报分析范式结合了数据驱动、模型驱动和专家驱动的方法,通过多角度、多层次的分析生成全面的情报。该方法通常包括以下步骤:
-
多源数据整合:综合利用数据收集、模型构建和专家咨询,获取全面的情报基础数据。
-
跨方法分析:使用数据分析、模型模拟和专家判断,进行多角度的情报分析。
-
综合情报生成:整合不同方法的分析结果,形成全面、立体的情报报告。
-
情报验证与反馈:通过实际应用验证情报的准确性和有效性,及时反馈和调整分析方法。
这种范式适用于复杂性高、需要多维度分析的情报任务,如国家安全评估、大型项目风险管理和全球市场分析。
2 情报分析流程
情报流程是情报服务有序开展的基本保障,面对复杂多变的世界形势,国家对支持战略性决策的情报需求比以往更为迫切。情报分析最基本的流程主要有两种:数据驱动的分析流程和假设驱动的分析流程。数据驱动的方法始于资料收集,然后形成假设,而假设驱动的方法始于初步的假设,并根据假设选择信息。
2.1 数据驱动的分析流程
数据驱动的分析流程由肯特提出[1] ,其核心步骤如下:
-
问题出现:识别需要战略情报人员关注的问题。
-
问题分析:了解在实际中哪些方面最重要以及哪些方法对用户最有用。
-
资料收集:根据分析的问题收集相关资料。
-
资料评价:对收集到的资料进行批判性的评价。
-
提出假设:研究经过评价的资料以发现内在意义,并提出假设。在实际操作中,假设可能在资料收集的早期阶段就开始出现,并在整个项目过程中不断发展。
-
证实假设:根据更有前景的假设,收集更多资料,来证实或否定这些假设。
-
假设确定:确定一个或多个比其他假设更接近真实的假设,并在表达阶段说明这些假设当前最接近真实。
这一分析流程强调从探索情报问题开始,逐步收集和评价资料,通过提出和证实假设来得出最接近真实的结论。
2.2 假设驱动的分析流程
假设驱动的分析流程结合联合军事情报学院的流程,情报分析过程如下[2] :
-
界定问题:在情报分析的初始阶段,需要进行结构化评估,以了解用户的需求。这不仅涉及对显性问题的关注,还需识别隐含的问题、潜在的危险和机会。分析人员必须展示他们对问题的权威性,这包括使用适当的研究方法、掌握相关题目的第一手知识、收集所有相关信息并接近信息源。清晰地表达事实和假设是至关重要的,同时要确保询问的问题是正确的,确认在及时性与质量之间取得平衡。
-
提出假设:在这一阶段,分析人员需要发现所有可能的假设,并咨询内外部专家以获取更多视角。在进行头脑风暴时,不应对任何想法进行评判,而是应开放性地提出各种可能性。从众多假设中挑选出能够详细分析的数量,并在信息收集和证据评价过程中注意新的假设出现。
-
收集信息:为验证假设,必须收集相关信息。这包括利用保密信息来获得洞察力,并详细描述信息源的性质(如直接证据和作证证据)。对于复杂的问题,清晰表达信息的可信度非常重要。与内外部专家联系以获取更多的信息,确保所有合理假设的信息都被收集,并积极寻找可以推翻某些假设的证据。发现最具诊断价值的证据,以判断不同假设的相对可能性。
-
评价假设:在此步骤中,分析人员需要针对每一假设提出论点,并利用矩阵图跟踪证据的发展。清晰地表达假设,并分析结论的敏感度是关键。为了确保结果的准确性,必须防止各种认知偏差的影响。
-
选择最可能的结论:最后,突出重要的发现和判断,通过提出政策建议使结论具有可操作性。强调什么是新的、不同的和需要特别注意的方面,同时说明不清楚的地方。为了填补信息缺口,提出进一步收集信息的方法,并发现趋势、模式、危险和机会的前兆。详细说明扩大事实基础的原则,说明支持判断的前提和假设,发现可能决定结果的驱动力量。
假设驱动的分析流程在复杂的、不确定性非常高、信息量非常大的情景下比数据驱动的模式更具效率。但这两种方法有三个共性的缺点:一是情报收集者和分析人员未能很好地共享信息;二是分析人员未
能客观地分析收集到的材料;三是用户未根据情报及时采取行动。此外,学者们也比较注重借鉴国外情报分析工作的经验因此,美国情报界认为完全有必要对以目标为中心的情报分析流程这一全新概念进行深入研究,改进传统情报理念,尽力避免情报失误。
2.3 以目标为中心的情报分析流程
与传统的情报流程不同,在以目标为中心的情报分析流程中,情报用户和搜集人员也加入到了流程之中,他们对目标同样有着一些有价值的见解。这使得情报分析人员要履行建立和维护目标图,找出并将情报用户需求转化为新的信息需求,提取可行性情报并确保将其传递给情报用户,并且还要管理分析流程并向其他参与人员传递信息,以确保整个流程的正常运转[3] 。
在以目标为中心的情报分析流程中,所有的参与者都是围绕同一个目标而共同努力,对于这个目标,我们不能简单地看成是一个方向或是用户提出的单一需求,而应该把目标看作一个复杂的系统,把复杂目标看作是一个网络。正如美国在对萨达姆政权采取军事行动之前,对伊拉克的军事、政治、经济以及文化等方面,都做了大量深入的情报收集和分析工作,而不仅仅是单一地考虑其军事实力或武器装备情况。也许情报用户只需要特定的信息,但分析人员在看待目标时必须要以系统的思维来思考,否则单一和片面的分析研究往往会导致思维的局限从而忽略事物之间的联系和相互影响,容易酿成情报失误。因此,在实际的情报分析活动中,我们应当采用以目标为中心的情报分析流程,把斗争双方都看成是一个网络,协同搜集人员、分析人员和用户,从而使己方的网络尽可能地有效运行,并致使对方的网络失去效能。
3 情报分析在军事领域的应用
面对复杂多变的国际环境与国内发展需求,确保国家安全成为了中国式现代化进程中不可或缺的关键环节。正如党的二十届三中全会所强调的,国家安全是国家发展的基石,对于推进中国式现代化具有至关重要的作用。为此,必须坚定不移地贯彻总体国家安全观,不断优化和完善国家安全体制,构建高质量发展与高水平安全之间的良性互动机制,以确保国家的长期稳定与繁荣。随着总体国家安全观的提出,中国国家安全情报的内涵也发生了变化。国家安全情报不再仅仅是传统意义上的隐蔽战线情报,而是涉及国家政治、经济、文化、社会等各领域的安全情报。
在军事领域,情报分析正在逐步利用先进的信息技术来提升其准确性和效率。耿等人[4] 探讨了以“大数据 + 人工智能”为代表的新一代信息技术对国防科技情报研究范式的重构。文章首先界定了数智赋能国防科技情报研究范式的概念内涵,提出了由生成链路、工作流程、实现路径等组成的总体框架。详细分析了数智赋能在“嵌入式”和“端到端”两种国防科技情报研究中的实现路径。研究结论为进一步认识数智赋能的国防科技情报研究范式提供了理论基础,有助于提升情报研究的质量和效益。
在军事领域,情报分析必须适应日益复杂的作战环境,以提高决策和行动的有效性。李[5] 研究了复杂作战环境下的目标情报分析,强调了目标类型多样化、目标联系复杂化、行动效果多域化的特点,对传统目标特征整编、弹目匹配和毁伤评估提出了新的要求。文章以美军目标工作模式为研究对象,从理论层面总结了目标情报分析的功能,区分了基本描述类和行动支援类两种目标情报产品,描述了各自的分析与生产流程,并提炼了复杂作战环境下目标情报分析的原则与特点。作者指出,为提高目标工作效能,目标工作体系需要多部门、多层级的协作,尤其是指挥、计划、作战和情报部门的密切合作。此外,情报分析和搜集部门需实现前后端的整体联动,专家应为分析与决策提供知识支持。为满足复杂作战环境的需求,技术开发需推动兵棋推演软件的实时环境表现,建立分类存储的大型情报数据库,搭建虚拟分析平台,以及开发支持各层级分析人员和搜集人员协作的网络共享平台。
在军事领域,情报分析不仅关注敌情和战术动态,还越来越多地关注舆情和情感动态,以获取对潜在威胁的早期预警。Malizan 等人[6] 的论文探讨了一种混合技术,用于从在线新闻文本中分类人们的情感,这些情感可能会影响国家安全。研究采用了基于词典和 Kansei 的方法,以确定文本中的情感极性和情感。这是一个有趣的领域,因为情感分析可以帮助我们理解人们对特定主题或事件的情感和意见。
4 人工智能在情报分析中的作用
在现代情报分析中,人工智能的应用正变得愈加重要。通过利用自然语言处理、机器学习、知识图谱、大数据、信号处理与分析等技术,人工智能极大地增强了情报分析的深度和广度。自然语言处理技术使得从海量文本数据中提取关键信息成为可能,而机器学习算法则帮助分析员从历史数据中识别模式和趋势。知识图谱通过揭示复杂数据中的关系网络,为情报分析提供了直观的知识框架。大数据技术则确保了处理和分析来自多种来源的庞大数据集的能力,提升了情报的准确性和时效性。
此外,信号处理与分析为理解和解码复杂通信信号提供了先进的方法,大语言模型则通过其强大的语义理解能力,支持更自然和准确的情报解读。多模态技术的应用更是将图像、文本、音频等不同数据类型的综合分析能力提升到新的高度。总体而言,人工智能正在通过这些技术创新,推动情报分析从数据驱动转向智能化分析,极大地提高了决策过程的效率和准确性。
4.1 自然语言处理(Natural Language Processing,NLP)
NLP 主要用于情报文本抽取工作,通过自动化技术从大量文本数据中提取有用的信息和情报。具体来说,NLP 可以解析和理解自然语言文本,识别其中的关键实体、事件、关系和主题。这些技术包括命名实体识别(NER)、关系抽取、事件检测、情感分析等。
4.1.1 实体抽取
首先,NLP 技术可以用于实体抽取,即识别和提取文本中的关键实体信息,包括人物、地点、组织、时间、事件等。实体抽取能够确定文本中的主要参与者和关键事件,从而构建情报的基本框架。例如,从一篇报道中自动提取出涉及的地点和人物,有助于构建地政治情报和人物关系网络。
Sheremetyeva[7] 探讨了构建适用于多语言文本处理的领域本体知识。研究旨在解决本体概念化和构建问题,以便支持多语言自然语言处理任务,如语义标注、多语言信息检索、信息抽取和机器翻译,特别关注恐怖主义领域的应用。研究采用自上而下和自下而上的混合方法,处理英语、法语和俄语的恐怖主义内容,明确区分语言相关的词汇知识和语言无关的概念知识,目标是提供直接映射“词元-本体概念”。
4.1.2 关系抽取
其次,NLP 技术还可以用于关系抽取,帮助分析人员发现文本中实体之间的关联。关系抽取能够揭示文本中的重要联系和互动,例如领导关系、协作关系、地理关联等,有助于构建更全面的情报图像,例如从新闻文章中抽取出实体之间的合作关系,有助于理解国际合作和联盟关系。
4.1.3 事件抽取
最后,NLP 技术还可用于事件抽取,NLP 技术可以帮助分析人员自动检测文本中的关键事件和行动,包括对事件的分类、时间和地点的确定以及事件的重要性评估。事件抽取有助于将情报文本的复杂性转化为可操作的情报,使分析人员能够更好地了解文本中所描述的事件和行动。
在军事领域,事件抽取也有着广阔的应用,可用于军事事态分析等,如 Chai H 等人[8] 提出了一种基于事件提取和关联的军事决策态势感知框架,文中描述到的态势感知属于高层次信息融合,在军事决策系统中发挥着关键作用。该文中设计了一种态势感知的框架并且构建了事件抽取的专家知识体系,给出了事件抽取规则模型。该模型描述了事件关联的方法,它可以关联从不同类型的传感器数据中提取的两个事件。最后介绍了态势感知仿真系统。例如,模拟空袭场景,分析事件提取和关联的结果,用来展示所提出方法及系统的功能。M Atkinson 等人[9] 提出了边境安全领域中的事件自动提取方法,文中概述了一种自动化工具,该工具可以自动的从在线新闻中提取有关边界安全相关事件的结构化信息,该研究有助于政府分析边境安全事务的动态并及时调整应对策略。
4.1.4 情感分析
此外,情感分析也是 NLP 技术在文本抽取中的一项重要任务。情感分析可以帮助分析人员了解文本中的作者态度、情感倾向和情感色彩,对于评估文本的可信度和情报的真实性至关重要。情感分析有助于识别文本中的主观信息,从而更好地理解信息来源的意图和倾向。例如,从社交媒体帖文中分析作者对某一国际事件的情感倾向,有助于判断帖文的真实性和背后的政治意图。
4.2 机器学习(Machine Learning,ML)和深度学习(Deep Learning,DL)
机器学习技术在实体关系识别方面也具有潜力。它可以自动识别文本中的实体之间的关系,如社交网络中的联系、组织之间的协作等,有助于构建更全面的情报图像,揭示隐藏的关联和网络结构。例如,机器学习技术可以从情报文件和新闻报道中自动发现潜在的情报线索和情报网络。
4.2.1 ML
基于机器学习的事件抽取无需太多的人工干预,且有着更强的泛化实用能力,其主要通过传统机器学习算法进行事件抽取,在构建特征阶段,需要进行大量的尝试。利用机器学习相关算法抽取事件更多的是在将抽取问题转化为分类问题,随后通过构建特征,从分类器输出计算结果,所以构建的特征对后续分类器输出结果会有很大的影响。
高凤帅等人[10] 为了能够对军事作战文书上的军事关系进行提取,采用了规则与 SVM 模型相结合的方法,其首先采用规则方式对军事作战文书中出现的相关实体关系信息进行提取,而后采用 SVM 模型对其中有用信息进行提取进行关系抽取研究。但是机器学习方法在实际应用过程中需要选取合适的特征进行后续计算,因此在构建特征时需要大量的实验去尝试,找出相关任务的最佳特征。
4.2.2 DL
目前最热门的方法是使用深度学习相关算法抽取事件,在自然语言处理领域,其在各项任务中都取得了良好的成绩,事件抽取任务也不例外,因此近些年来,使用深度学习相关算法模型解决事件抽取问题已经吸引了众多学者的目光。
朱等人[11] 采用双向循环神经网络与注意力机制相结合的方式对军事领域的实体关系抽取进行研究,在词向量阶段引入了词的位置信息,通过双向循环神经网络获取丰富的上下文语义特征,优化关系抽取结果。何等人[12] 将基于双向循环神经网络与注意力机制相结合的关系抽取方法应用到老挝语的军事关系抽取任务研究中,并在词向量阶段引入了词性特征,优化关系抽取结果。
4.3 知识图谱与数据可视化技术
依托知识图谱与数据可视化技术,提高战场态势感知能力。随着作战空间向多维全域不断扩展延伸,各类智能化无人系统、智能传感器遍布整个战场环境,使得战场形势日趋复杂。在军事情报分析方面,利用知识图谱、关联分析与数据可视化技术实现对孤立、碎片情报数据的多维深度分析,对不同来源的情报信息进行整合分析,动态呈现战场态势全景图,使得战场变得更加清晰、透明,及时准确地研判敌方的战略企图,真正做到“知已知彼”。
任等人[13] 探讨了在军事领域中利用知识图谱进行情报分析,以满足对外军舰船活动进行智能分析的需求。随着现代战争向网络化、智能化和精确化发展,分析战场情报信息和挖掘敌情规律变得尤为重要。研究针对舰船活动的情报信息,构建了外军舰船知识图谱,并开发了舰船活动规律的挖掘与分析技术。该系统基于信息挖掘技术,对舰船的历史信息进行时空和事件关联分析,形成面向舰船活动的垂直领域情报知识图谱,支持基于时间、区域、对象和事件的查询与规律挖掘,并对舰船活动信息进行多维度画像。系统由三个主要部分组成:
-
数据采集模块:收集来自互联网、结构化数据源和卫星影像的数据。
-
知识图谱构建模块:包括舰船知识建模、知识抽取、知识融合、知识存储和知识应用。
-
规律挖掘模块:进行舰船活动规律的挖掘与分析,并提供图形化展示。
知识应用包括语义搜索、查询搜索、智能问答、数据分析、图谱可视化和模型解释,通过这些功能实现对舰船活动的全面分析和可视化展示。
赵等人[14] 介绍了一种用于军事情报分析的军事事理图谱构建与交互式分析工具。该工具通过使用军事领域内常见的事件抽取模型,结合事理模式抽象技术,构建了包含事件演化模式的军事事理知识图谱。基于此图谱,开发了具备可视化分析功能的交互式分析工具,使用户能够更直观高效地观察和分析军事情报,从而提升现代部队的指挥信息化水平。
4.4 信号处理与分析
情报分析依赖于人脑的认知过程,而脑机接口技术(BCI)能显著提升情报人员的分析能力和监测认知偏差。通过重复经颅磁刺激(rTMS)和经颅直流电刺激(tDCS),BCI 技术可增强注意力、记忆力和信息处理速度,提高分析效率和准确性。此外,BCI 能将认知活动可视化,监测认知负荷和情绪波动,识别认知偏差。利用这些技术,情报人员可以系统地评估和纠正认知偏差,降低误判风险[15] 。
4.5 大语言模型
大语言模型在阅读理解、摘要、翻译、人类意图识别、代码生成、分类等方面的能力引起了科研领域的广泛关注。大语言模型与情报行业结合,将转变情报采集、加工、分析和服务的方式和流程。
4.5.1 BERT 模型
在过去的应用中,有直接利用现有模型来进行情报任务开发的,马江微等人[16] 采用了基于 BERT 模型与关系位置特征的方法对军事关系抽取任务进行研究,其首先通过 BERT 模型获取文本对应的词向量,而后采用强化学习的方式对关系触发词与关系实体进行学习识别,在远程监督数据集上关系抽取效果较好;鲁义威等人[17] 采用了 BERT 模型与注意力机制相结合的方式对军事关系抽取任务进行研究,通过 BERT模型获取词向量后,加入位置编码后送入双向循环神经网络与注意力机制进行关系抽取,该方法能够较好地对军事关系进行抽取。
4.5.2 生成式预训练模型
而以 ChatGPT、GPT-4 为代表的生成能力更强大的语言模型在情报领域的应用实践还相对较少。GPT系列模型是一种“生成式”模型,具有通过训练模型预测下一个字(nextword)的能力,从而达到文本生成的目的。由于模型每次对同一个输人问题生成不同的答案,因此大语言模型在回答无唯一答案的问题时展现出比人类更活跃的思维能力与更多的知识储备。利用大语言模型这一优势,一方面可以拓展情报工作者的分析思路,另一方面能为情报工作者提供更多情报线索,辅助挖掘情报信息。郝等人[18] 探讨了 GPT 技术对作战筹划的影响及其在军事指挥系统中的应用。通过分析 GPT 技术在情报整合、智能分析、实时决策支持、跨领域知识整合等方面的作用论证了其在提升作战效率、强化决策支持和促进作战指挥系统现代化发展方面的重要性。同时,还探讨了 GPT 技术在作战筹划中所面临的挑战与限制,并提出了未来发展的展望和建议。
大语言模型工具中几个关键点的技术实施方法如下:
-
对情报数据检索方式的影响
在信息处理效率提升方面,GPT 技术能够快速处理和理解大量文本信息。在情报分析领域,往往需要分析各种来源的情报数据,包括文字报告、社交媒体内容、战地情报等。GPT 模型可以帮助分析人员快速筛选、摘要和理解这些信息,从而更好地把握局势动态和敏感信息。情报工作者需要掌握如何撰写提示语,以自然语言交谈方式进行检索,代替传统的关键词和搜索引擎技巧。结合给定查新项目的关键词、摘要等信息或用户输入的简单查询关键词或短句,通过与大模型交互扩展主题及关键词,并结合所设计的用于检索条件生成的提示(prompt)模板,自动生成组合型逻辑检索式。自然语言交互带来的优势使其在商业应用中逐步拓展,如 NewBing 展示了搜索引擎向交互式搜索的转变,德温特也在其服务系统中推出了 smart search 功能,允许用户输入自然语言进行检索,降低了使用门槛,使新用户和不同学科背景的情报工作者能够更容易地查找相关信息。
-
对情报数据加工方式的影响
为了更好地应用大语言模型,基于大模型的调优、提示学习、模型评价等工作将逐步渗透到情报分析的日常加工生产中,这些情报信息的加工方式方法和传统方法有所区别。通过对历史数据和现有情报进行训练,GPT 模型可以识别出潜在的模式和趋势,帮助分析人员做出更准确的情报预测和决策支持,目前,大语言模型的出现可能实现基于语义的情报内容加工、情报融合,为过去很难或无法实施的情报任务提供可行的解决方案。对查新项目以及使用检索式查询得到的文档,先依据文档结构及内容结构拆解得到内容片段,利用大模型的嵌入(embedding)接口得到每个片段的嵌入向量,使用向量搜索比较技术,得到目标文档各片段高于经验阈值的相似片段候选列表。
-
对情报分析方法和过程的影响
由于大模型具有很强的语义理解和知识记忆能力,在知识掌握的全面性方面优于人类,并且未来会进一步超越人类。因此,大语言模型的通识能力能够辅助情报分析人员进行情报研究前期的预调研工作。大语言模型将完成一些诸如情报检索、摘要总结、信息汇总等大量基础性分析工作。情报分析人员的工作重点将转向更深层次的情报分析。在使用情报分析工具的过程中,由于大语言模型在准确性、分析偏见、无提示错误等方面存在缺陷,情报分析人员可采用多个分析工具对比分析、交互补充和验证,对人工智能的初步数据分析结果进行鉴别。但是,大模型在信息资源收集方面的偏见和局限性、出现错误的可能性,使得对检索结果的去伪存真、摒弃错误信息成为情报分析人员需要重点关注的任务。对于查新项目,逐次依据查新点及相似片段的内容,调用大模型的接口生成对比结果形成检索结果,然后把各片段的对比结果拼接成新的摘要综述提示,使用大模型的摘要能力得到汇总的查新结论,并按要求填写到指定的报告模板中,自动生成查新报告。
在军事领域,情报分析对于战略制定和作战决策至关重要。情报分析人员需要从大量数据中提取有价值的信息,为指挥官提供准确的敌情、战场环境和潜在威胁评估。大模型具备处理大规模数据的能力,能够快速准确地分析各种情报数据,包括文本、图像和声音等。在情报分析中,大模型可以通过学习大量数据样本,提取关键特征和模式,实现对情报数据的深度挖掘和分析。首先,大模型可以用于情报数据的预处理,通过去噪和填充缺失值提高数据质量。其次,大模型能够自动提取情报数据中的关键特征,从而提高分析的准确性和效率。最后,通过学习历史数据,大模型可以预测未来的敌情变化和战场态势,提供及时预警和决策支持,并揭示数据中的趋势和模式,为战略制定和作战决策提供有力支持[19] 。
在 GPT-4 工具辅助下的新业务流程:
-
调用 GPT-4 的标准接口,实施交互式问答,使查新员掌握相关知识。
-
依据查新主题和相关概念提炼相关主题词,采用提示模板生成辅助检索式,人工验证并产生最终查新检索式。
-
离线状态下检索并下载相关文献。
-
在 GPT-4 基础上开发文献对比和定位扩展工具、报告撰写扩展工具,利用文献对比工具生成文献对比结果,并经过查新员确认后生成相关格式文本。
-
相关格式文本导人报告撰写工具,获取报告初稿。
在 GPT-4 工具辅助下的业务:
-
文本分类
Peña 等人[20] 收集了西班牙语公共事务文件的文本语料库,并使用该数据集评估了文本理解模型和生成模型在多标签主题分类任务中的表现。具体而言,研究包括三种基于 RoBERTa 的文本理解模型和生成模型,结合神经网络、随机森林和支持向量机(SVM)三种分类器进行实验。结果显示,即使在数据样本数量有限的情况下,使用 SVM 分类器的文本理解模型在公共事务领域的主题分类任务中仍然表现出有效的策略。
-
信息提取
Zhang 等人[21] 提出了专为遥感领域多传感器图像理解设计的多模态大型语言模型 EarthGPT。该模型在视觉增强感知、跨模态理解和多传感器多任务指令调整方面进行了创新,能够处理光学、合成孔径雷达(SAR)和红外等多传感器图像,实现通用遥感图像理解。作者构建了包含超过 100 万个图像-文本对的 MMRS-1M 数据集,用于训练和评估 EarthGPT,填补了现有多模态大型语言模型在遥感专家知识方面的不足。EarthGPT 通过视觉特征与语言特征的连接,生成多模态输入,并在自然通用数据集上进行训练,实现视觉-语言对齐,开发了视觉增强感知机制、跨模态理解方法和统一指令调整方法,提升了遥感领域多模态图像理解的能力。
-
问答
-
评估
-
文本生成
Tong 等人[22] 研究了大型语言模型(LLMs)在公共安全领域的表现,并构建了一个评估基准 CPSDbench。 CPSDbench 整合了公共安全相关数据集,从文本分类、信息提取、问答和文本生成四个维度对 LLMs
进行评估。研究还引入了创新评估指标,以量化 LLMs 的效率。通过分析评估,研究揭示了现有模型在公共安全任务中的优势和局限,并为未来开发定制化 LLMs 提供了参考。
总的来说,GPT 技术对情报分析与决策支持具有革命性的影响。它不仅可以提高情报分析的效率和准确性,还可以为决策者提供更全面的信息支持,帮助其做出更有效的决策,应对复杂多变的安全挑战。随着技术的不断发展和完善,GPT 技术将在情报领域发挥越来越重要的作用。
4.5.3 多模态
在情报分析领域,多模态技术的应用正逐渐成为推动智能化发展的重要驱动力。通过整合不同类型的数据源,如视觉、声学、地理空间和文本信息,多模态系统能够提供更全面和精确的情报分析能力。
Astapov 等人[23] 探讨了一种自主地面情报、监视和侦察(ISR)系统,包括航空和有人监视系统以及信息收集中心。ISR 系统利用声学、磁性和被动红外(PIR)传感器进行目标检测和识别,传感器之间通过异步自组网无线传感器网络(WSN)配置进行通信,以实现环境监测和信息交换。
BJ Connolly 等人[24] 研究介绍了战场信息和战术引擎(BITE),这是一个利用大型语言模型(LLM)来处理战斗相关数据并辅助决策的系统。通过在多人视频游戏《Squad》中的测试,BITE 展示了有效解析音频通信、提供战术建议的能力,但同时也暴露出安全性、可靠性和实时性方面的挑战。尽管存在局限性, BITE 在军事训练和模拟领域展现出潜在的应用价值。
参 考 文 献
-
KENT S. Strategic intelligence for american world policy: Vol. 2377[M]. Princeton University Press, 2015.
-
WALTZ E. Toward a maui nite intelligence analytic process model[J]. Arlington: Veridian Systems, 2003, 8.
-
吴素彬, 陈云, 王科选, 等. 美国“以目标为中心”的情报分析流程研究[J]. 情报杂志, 2013, 32: 6-9+21.
-
耿国桐, 李晓松, 赵柯然. 数智赋能国防科技情报研究范式重构[J/OL]. 国防科技, 2024, 45: 128-135. DOI: 10.13943/j.i ssn1671-4547.2024.01.17.
-
李铮. 复杂作战环境下目标情报分析:职能、流程与原则[J]. 情报杂志, 2022, 41(06): 14-20+65.
-
MALIZAN N A, RAZALI N A M, HASBULLAH N A, et al. Opinion mining hybrid technique to classify people’ s emotions in text using kansei and lexicon-based approach for national security domain[C]//AIP Conference Proceedings: Vol. 2617. AIP Publishing, 2022.
-
SHEREMETYEVA S, ZINOVYEVA A. On modelling domain ontology knowledge for processing multilingual texts of terroristic content[C]//Digital Transformation and Global Society: Third International Conference, DTGS 2018, St. Petersburg, Russia, May 30–June 2, 2018, Revised Selected Papers, Part II 3. Springer, 2018: 368-379.
-
CHAI H, DU Y. A framework of situation awareness based on event extraction and correlation for military decision support[C]//2012 IEEE International Conference on Mechatronics and Automation. IEEE, 2012: 192-196.
-
ATKINSON M, PISKORSKI J, TANEV H, et al. Automated event extraction in the domain of border security[C]// User Centric Media: First International Conference, UCMedia 2009, Venice, Italy, December 9-11, 2009, Revised Selected Papers 1. Springer, 2010: 321-326.
-
高凤帅, 杨化斌. 结合词语规则和 SVM 模型的军事命名实体关系抽取方法[J]. 信息通信, 2017(11): 162-163.
-
朱珊珊, 唐慧丰. 基于 BiLSTMAtt [J ]. , 2019, 9(04) : 96 − 99.
-
何阳宇, 易晓宇, 唐亮, 等. 基于 BLSTM-ATT 的老挝语军事领域实体关系抽取[J]. 计算机技术与发展, 2021, 31(05): 31-37.
-
任昊利, 罗飞. 舰船活动规律知识图谱分析系统研究[J]. 舰船科学技术, 2022, 44(01): 159-164.
-
赵文正, 王羽, 姜晓夏, 等. 军事事理图谱构建与交互式分析工具[J/OL]. 指挥信息系统与技术, 2022, 13(03): 59-64. DOI: 10.15908/j.cnki.cist.2022.03.010.
-
朱鹏锦, 黄南翔, 汪灏. 脑机接口技术在军事情报领域的应用前景及挑战[C]//第十二届中国指挥控制大会论文集(上册). 国防科技大学国际关系学院;, 2024: 412-416.
-
马江微, 吕学强, 游新冬, 等. 融合 BERT 与关系位置特征的军事领域关系抽取方法[J]. 数据分析与知识发现, 2021, 5(08): 1-12.
-
鲁义威, 杨若鹏, 殷昌盛, 等. 融合预训练模型与注意力机制的军事实体关系抽取方法[J]. 信息工程大学学报, 2022, 23(01):108-114.
-
郝铨坤, 吕恩虎, 霍存地. GPT 技术对作战筹划的影响[C]//第十二届中国指挥控制大会论文集(上册). 中国人民解放军73676 部队;, 2024: 443-447.
-
汲克山, 刘思培, 李清玉, 等. 大模型在军事领域的应用与展望[C]//第十二届中国指挥控制大会论文集(下册). 北方信息控制研究院集团有限公司;, 2024: 79-83.
-
PEÑA A, MORALES A, FIERREZ J, et al. Leveraging large language models for topic classification in the domain of public affairs[C]//International Conference on Document Analysis and Recognition. Springer, 2023: 20-33.
-
ZHANG W, CAI M, ZHANG T, et al. Earthgpt: A universal multi-modal large language model for multi-sensor image comprehension in remote sensing domain[J]. IEEE Transactions on Geoscience and Remote Sensing, 2024.
-
TONG X, JIN B, LIN Z, et al. Cpsdbench: A large language model evaluation benchmark and baseline for chinese public security domain[A]. 2024.
-
ASTAPOV S, PREDEN J S, EHALA J, et al. Object detection for military surveillance using distributed multimodal smart sensors[C]//2014 19th international conference on digital signal processing. IEEE, 2014: 366-371.
-
CONNOLLY B J. Battlefield information and tactics engine (bite): a multimodal large language model approach for battlespace management[C]//Artificial Intelligence and Machine Learning for Multi-Domain Operations Applications VI: Vol. 13051. SPIE, 2024: 1305103.
更多推荐
所有评论(0)