• 首页 >  人工智能 >  大模型
  • 智慧图书馆技术应用联盟:2024图书馆领域大模型创新应用需求调研报告(征求意见稿)(76页).pdf

    定制报告-个性化定制-按需专项定制研究报告

    行业报告、薪酬报告

    联系:400-6363-638

  • 《智慧图书馆技术应用联盟:2024图书馆领域大模型创新应用需求调研报告(征求意见稿)(76页).pdf》由会员分享,可在线阅读,更多相关《智慧图书馆技术应用联盟:2024图书馆领域大模型创新应用需求调研报告(征求意见稿)(76页).pdf(76页珍藏版)》请在本站上搜索。

    1、图书馆领域大模型创新应用需求调研报告图书馆领域大模型创新应用需求调研报告(征求意见稿(征求意见稿 V0.9)上海图书馆(上海科学技术情报研究所)智慧图书馆技术应用联盟2024 年 5 月说明说明本报告为图书馆领域大模型创新应用需求调研报告的征求意见稿,仅供内部讨论、意见征集使用。在本报告的编纂过程中,得到诸多同仁及联盟成员的宝贵支持和专业意见,对此表示衷心的感谢。本报告版权属于上海图书馆(上海科学技术情报研究所)、智慧图书馆技术应用联盟。本报告第二章节行业应用调研部分,整理自国内外公开网络信息和机构研报,特此致谢!感谢各有关机构对大语言模型技术发展与行业应用的深入调研,并公开分享这些宝贵的学习

    2、资源。由于大模型技术与应用领域的飞速发展,本报告编写期间,很多方面如大模型能力、应用框架、多模态和智能体等方面已发生很多进展,虽然本报告尽可能考虑了相关技术对领域应用的影响,但还是强烈建议您在参考本报告内容时,密切关注大模型技术的最新进展和动态。同时,我们深知本报告难免还存在不少疏漏与不足之处,因此我们对此表示歉意,并希望您提供宝贵的反馈建议。报告各章编辑:报告各章编辑:第一章 前言(嵇婷)第二章 大模型行业应用调研(许磊)第三章 大模型对图书馆的影响(嵇婷、周纲、许磊)第四章 智慧图书馆中的大模型应用(嵇婷、周纲、许磊)第五章 图书馆典型大模型应用需求及场景举例(嵇婷、周纲、许磊、刘倩倩、姚

    3、馨、刘贝玲、徐凡、吕思诗、张春景)第六章 总结与展望(嵇婷)联系方式:联系方式:如对报告有任何建议,欢迎将反馈意见发送至邮箱:。1目录目录第一章 前言.1第二章 大模型行业应用调研.32.1 大模型行业应用价值.32.2 大模型行业应用服务.42.3 大模型行业应用技术方案.62.3.1 提示词工程.62.3.2 检索生成增强.92.3.3 智能体.102.3.4 模型微调.132.4 大模型行业应用案例.142.4.1 医药健康.162.4.2 金融保险.172.4.3 文化教育.18第三章 大模型对图书馆的影响.203.1 图书馆大模型影响分析.203.2 图书馆大模型应用策略.233.3

    4、 图书馆大模型应用路径.253.4 图书馆大模型应用范式.273.5 图书馆大模型技术架构.29第四章 智慧图书馆中的大模型应用.314.1 智慧服务中的大模型应用.324.2 智慧业务中的大模型应用.364.3 智慧管理中的大模型应用.384.4 智慧空间中的大模型应用.41第五章 图书馆典型大模型应用需求及场景举例.445.1 智慧咨询服务.455.1.1 需求分析.455.1.2 场景举例.455.1.3 已有案例.465.2 智慧资源发现.475.2.1 需求分析.475.2.2 场景举例.475.2.3 已有案例.495.3 智慧阅读推广.495.3.1 需求分析.495.3.2 场

    5、景举例.505.3.3 已有案例.515.4 智慧知识服务.525.4.1 需求分析.525.4.2 场景举例.5325.4.3 已有案例.555.5 智能采编辅助.565.5.1 需求分析.565.5.2 场景举例.575.5.3 已有案例.605.6 数字资源智能加工.615.6.1 需求分析.615.6.2 场景举例.615.6.3 已有案例.625.7 数字人文智慧研究与服务.635.7.1 需求分析.635.7.2 场景举例.635.7.3 已有案例.665.8 馆员智慧助手.675.8.1 需求分析.675.8.2 场景举例.675.8.3 已有案例.68第六章 总结与展望.70附

    6、:云瀚应用商店 AI 应用列表.721第一章 前言第一章 前言人工智能(AI)技术以其迅猛的发展势头,正在成为推动社会进步的重要力量。在 AI 时代浪潮的推动下,以大模型技术为代表的生成式人工智能已经成为推动科技进步和产业变革的重要力量,为各行各业带来了革新的可能。2023 年 7月,国家互联网信息办公室等七个中央部门联合发布了生成式人工智能服务管理暂行办法,文件鼓励生成式人工智能技术在各行业、各领域的创新应用,探索优化应用场景,构建应用生态体系。2024 年,政府工作报告中明确提出深化人工智能研发应用,开展“人工智能+”行动。国家鼓励人工智能技术与经济社会各领域深度融合,以推动各行业应用创新

    7、,赋能百业智能化转型升级。伴随着新一代 AI 技术的兴起,图书馆界也迎来了重要的转型契机,步入了一个既充满机遇又面临挑战的新时代。在这一新的技术背景下,图书馆作为信息资源中心和知识服务核心场所,必须适应新时代的发展趋势,把握机遇,积极应对将 AI 融入运营与服务中的复杂挑战。为了有效应对变革,上海图书馆(上海科学技术情报研究所)联合上海人工智能研究院、智慧图书馆技术应用联盟于2023 年 9 月发布了图书馆大规模模型创新与应用白皮书。白皮书从宏观层面,解读了智慧图书馆在 AI2.0 时代的发展环境和机遇,勾勒了大模型技术赋能智慧图书馆全景应用视图、实现路径、应用架构,为行业推进场景创新、落地实

    8、践、生态建设提出了方向性、建设性的参考与建议。本报告旨在作为图书馆大规模模型创新与应用白皮书的补充,深入探讨大模型技术在图书馆领域的应用价值与潜在影响。在白皮书提出的图书馆领域大模型应用的总体架构与应用视图的基础上,本报告进一步分析了大模型技术在智慧图书馆中可实践应用的具体领域、场景和需求。本报告旨在揭示大模型在智慧图书馆中的应用潜力与可能性,提供图书馆在探索大模型技术创新应用的参考,以助力图书馆更好地把握人工智能发展所带来的机遇。报告第二章首先对大模型的价值、技术、行业应用进行调研,旨在洞察行业趋势,评估大模型技术在图书馆领域的应用前景。第三章在详细分析了大模型对图书馆的影响后,提出了图书馆

    9、应用大模型的策略、路径和架构。报告第四章根据当前技术发展和落地现状,梳理了图书馆在智慧服务、智慧业务、智慧管理、智慧空间四个领域中,当前可实验、实施或展望的 AI 应用,并进行总结。第五2章重点聚焦于图书馆中的八个典型领域,通过需求分析、场景举例以及相关实践案例,深入探讨了大模型技术在这些领域的应用潜力。这八个领域是:参考咨询、资源发现、阅读推广、学术服务、采编辅助、资源加工、数字人文和管理决策,通过对这些关键领域的详细讨论,报告意在激发更多的创新思维,促进图书馆领域在大模型技术的开发应用和产品设计方面的思考与实践。人工智能技术正处于快速演变之中。因此,本白皮书所阐述的观点和建议反映了当前阶段

    10、性的探索与思考。这些内容旨在为图书馆领域的未来发展提供启发,并促进对新兴技术趋势的理解和应用。随着技术进步和实践经验的积累,未来的应用模式和需求可能会有所变化,需持续对这些变革保持关注,并适时进行调整和优化以适应新的发展趋势。我们深知报告中存在诸多不足之处,因此,我们也诚挚邀请各界人士进行批评指正,我们将借助各方经验对报告进行修改和完善,从而为智慧图书馆大模型创新应用提供有益参考。3第二章 大模型行业应用调研第二章 大模型行业应用调研2.1 大模型行业应用价值大模型行业应用价值2022 年 11 月上线的生成式人工智能(AIGC,AI-Generated Content)应用ChatGPT,在

    11、“大模型+大数据+大算力”的加持下,其在语义理解、文本创作、代码编写、逻辑推理、知识问答等领域表现卓越,在具备了多场景、多用途、跨学科的任务处理能力,是人工智能技术极为关键的发展节点1。ChatGPT 的横空出世,标志着大语言模型(Large Language Model,LLM,简称“大模型”)突破自然语言处理(Natural Language Processing,NLP)领域以小模型为主导的传统发展范式。通常认为,大语言模型是基于海量自然语言数据进行预训练而得到的超大型深度学习模型,参数通常从数十亿到超千亿。底层基于 Transformer 深度神经网络,由具有自注意力功能的编码器和解码

    12、器组成,编码器和解码器从一系列文本中提取含义,能够理解更大范围上下文的单词和短语之间的语义关系。这种巨量数据训练架构使得大语言模型具有了被称为“涌现”的泛化推理能力2,使其具有了通用人工智能(AGI)的特性。用同样方法对海量图片、音频、视频等多媒体信息结合语言数据进行预训练和指令微调的超大型深度学习模型也是大语言模型的一种发展,通常称为多模态大模型。也可以将上述两者并称为“大模型”。大模型的“涌现能力”不仅可以实现文本、图像、音频、视频的生成,构建多模态,还可以在更为广泛的领域生成新的设计,新的知识,甚至实现广义的艺术和科学的再创造3。大模型的“大规模”和“预训练”属性,决定了其具有能力泛化、

    13、技术融合、应用支撑三大核心作用4。(1)能力泛化方面,大模型预先在海量通用数据上训练使其具备了通用任务的泛化能力,更可进一步结合垂直行业和业务场景需求进行模型微调和应用适配,摆脱传统 AI 能力碎片化、作坊式开发的束缚。大模型得益于其“大规模预训练微调”的范式,可以很好地适应不同下游任务,展现出它强大的通用性。(2)技术融合方面,文本大模型融合语言、视觉、听觉等多模态信息,通1中国人工智能学会.中国人工智能系列白皮书大模型技术(2023 版),https:/ 开启通用人工智能浪潮M.中译出版社,2023.4海通国际.MaaS Model as a Service 模型即服务,https:/ 2

    14、”的效果,显著提升大模型的功能丰富性和性能优越性1、2。(3)应用支撑方面,大模型涌现能力的重要体现是复杂任务推理2。复杂推理能够使大模型应用通过与工具、用户和外部环境的互动来完成复杂的指令。这为构建大量应用程序提供了机会,从而使大模型有机会成为下一代计算平台/操作系统,有效支撑智能终端、系统、平台等产品应用落地,解决传统 AI 应用过程中存在的壁垒多、部署难问题。从人工智能到各行业的商业应用,可以看作是上下游的关系。大模型因其自身在能力泛化与技术融合方面的优势,使其在应用支撑方面具有先进性;同时大模型做到了相对标准化,下游可以降低对算法的使用成本,以及商业应用的适配成本。因此,大模型在“AI

    15、+”行业中将承担“基础设施”式的功能,作为底座将 AI技术赋能千行百业。也就是说,在基于数据的互联网时代、基于算力的云计算时代之后,将进入基于大模型的 AI 时代。在未来,基于大模型,人工智能将如供水供电一般流向终端,流向用户和企业。2.2 大模型行业应用服务大模型行业应用服务大模型应用落地场景按照架构层级,一般可分为:模型层、中间层和应用层5。(1)第一层,为上游基础模型层,也就是由预训练模型为基础搭建的 AIGC技术基础设施层。由于预训练模型的高成本和技术投入,具有较高的进入门槛,不在本文讨论范围。(2)第二层,为中间层,即垂直化、场景化、个性化的模型和应用工具。预训练的大模型是基础设施,

    16、在此基础上可以快速抽取生成场景化、定制化、个性化的小模型,实现在不同行业、垂直领域、功能场景的工业流水线式部署,同时兼具按需使用、高效经济的优势。随着兼具大模型和多模态的 AIGC 模型加速成为新的技术平台,模型即服务(Model as a Service,MaaS)开始成为现实。OpenAI 创始人山姆奥特曼(Sam Altman)“认为中间那一层会创造很多价值。5腾讯研究院.AIGC 发展趋势报告 2023,https:/ C 端用户的需求,将 AIGC 模型和用户的需求无缝衔接起来实现产业落地。根据内容生产模态,AIGC 能够被分为四大基础模态,包括文本、音频、图像、视频,每一种模态技术

    17、都有着独特的应用场景和特点。此外,这四类模态的融合还带来第五类模态跨模态内容生成模式,支持创造出更为丰富多彩的 AIGC 生成内容6。2023 中关村论坛人工智能大模型发展论坛,阿里云智能集团 CTO 周靖人表示,“以模型为中心的开发范式(MaaS)已成为行业标准,未来应用开发的整个链路都会基于这一理念来做”。所谓 MaaS,模型即服务,指的是用户可以直接通过 API 调用基础大模型,为不同的业务场景,来构建、训练和部署专属模型。云平台提供从数据、模型到应用服务的全周期管理和工具。AI 产业的场景落地一直面临碎片化、长尾场景数据较少导致模型训练精度不够等行业痛点。传统“小模型”范式的 AI 应

    18、用开发流程一般针对单一场景,独立地完成一系列开发环节,包括模型选择、数据处理、模型优化和模型迭代。因此,AI 应用在定制化需求、长尾需求下的开发效率较低,且模型精度、性能、可扩展性等指标质量也会受到影响。随着大模型的出现,AI 应用开发流程转变为,调用通用流程、结合行业经验、解决实际问题。Maas 服务商即把大模型作为重要的生产元素,依托于既有 IaaS 设施与 PaaS平台架构,为下游客户提供以大模型为核心的数据处理、模型托管、模型训练、模型调优、推理部署、智能应用开发等多样化需求,保障客户的大模型能够顺利交付。客户则通过低成本、高效率的 MaaS 平台服务获得 AI 能力,完成 AI 应用

    19、的开发、优化及部署,将 AI 能力应用渗透到各行各业的场景业务中7。6横琴粤澳深度合作区数链数字金融研究院,亚洲数据集团.人工智能行业智能时代的生产力变革:AIGC产业应用实践,https:/www.bj- 年中国 AIGC 产业全景报告,https:/ 2.2:MaaS 行业应用服务模式8目前,微软云 Azure、阿里云、华为云、腾讯云、百度云、京东云等云计算大厂,都已经推出了 MaaS 服务。以微软云的 Azure OpenAI 服务为例,就支持开发者调用 OpenAI GPT-4、GPT-3、Codex 和 DALL-E 等模型的 API,来构建、微调模型,为应用提供支持。腾讯云从产业客

    20、户需求场景出发,依托腾讯云 TI平台打造模型精选商店。腾讯云已联合行业头部企业,为十大行业输出了超过50 个解决方案,提供一整套模型服务工具链。传统企业软件服务商金蝶利用百度智能云千帆平台所提供的大模型推理、微调以及算力资源服务,发布了新一代企业管理产品金蝶云苍穹 GPT9。2.3 大模型行业应用技术方案大模型行业应用技术方案大语言模型在语言生成、知识利用、复杂推理等基础能力上存在诸多问题,典型如幻觉、知识时效性、专业化生成能力较弱、推理不一致等问题10。在实际应用中需要综合运用提示词工程、检索生成增强、智能体、模型微调等多种策略和技术方案提升大模型的稳定性与一致性。2.3.1 提示词工程提示

    21、词工程简单来说,现阶段基于 Transformer 架构的主流大模型,是根据输入预测下8艾瑞咨询.2023 年中国 AIGC 产业全景报告,https:/ engineering)成为大模型实际应用的主要方法。所谓提示是经过精心构造由不同要素组成的任务指令来引导模型的输出,使大模型能够在不同的任务和领域中表现出色。而提示的质量也在很大程度上影响了大模型在下游任务中的表现,因此需要通过人工设计或自动优化的方法来生成合适的任务提示。人工设计大语言提示需要考虑四个关键要素,即任务描述、输入数据、上下文信息和提示策略。基于这四个关键要素,提示设计的基本原则分别是:清晰地表达任务目标;分解为简单且详细的

    22、子任务;提供少样本示例;采用模型友好的提示格式11。(1)清晰地表达任务目标。在使用大模型时需要给出清晰明确的指令。具体来说,一个清晰详尽的任务描述中应当包含任务的各种要素信息,如任务目标、输入/输出数据和回复限制。(2)分解为简单且详细的子任务。将一个复杂任务分解为若干个相对独立但又相互关联的子任务,每个子任务都对应原始任务的某个方面或步骤。这种策略有助于减少复杂任务的解决难度:通过将复杂任务分解为若干个子任务并按照一定的顺序处理这些子任务,模型能够逐步获得最终的答案。(3)提供少样本示例。在提示中加入少量目标任务的输入输出作为任务示例(即少样本示例),有助于大模型在无需调整参数的前提下学习

    23、输入与输出之间的语义映射关系,提升大模型解决复杂任务的能力。(4)采用模型友好的提示格式。大模型采用专门构建的数据集进行预训练,因此可以从数据集中学习到大量的语言表达模式,发现并利用这些语言表达模式可以帮助我们更有效地使用大模型完成特定任务。如 Markdown 语法、XML 标签等。遵循上述原则设计的简单提示对于大多数的问题都是有效的,但涉及复杂推理任务时,则需要更高级的提示策略。其中被广泛应用的就是思维链(Chain ofThought,CoT)。为增强大模型在各类复杂推理任务上的表现,Wei 等人12设计了思维链的提11赵鑫,李军毅,周昆,唐天一,文继荣.大语言模型,https:/llm

    24、book-zh.github.io/,202412Wei J,Wang X,Schuurmans D,et al.Chain-of-Thought Prompting Elicits Reasoning in Large LanguageModelsJ.arXiv,2022.8示策略。思维链的主要思想是通过向大模型展示一些少量推理过程,大模型在回答时也会显示推理过程,这往往会引导出更准确的结果。具体来讲思维链提示在原先的少样本示例的输入输出之间,插入了中间的推理步骤来指导从输入到输出的推理过程,即“输入,推理步骤,输出”形式,也可称为少样本思维链提示(Few-Shot CoT)。另外,最简单的

    25、思维链提示,可以在提示中加入如“Lets thinkstep by step.”之类的诱导性指令,让大模型先生成思维链再回答问题来提高准确率,也就是零样本思维链提示(Zero-Shot CoT)13。也有更多基于思维链的优化或变体提示策略,如自洽性(Self-Consistency)、最少到最多提示过程(Least toMost prompting,LtM)、思维树(Tree-of-Thoughts、ToT)等。更多特定场景下的提示策略可阅读相关综述14。图 2.3.1:思维链提示样例12常用的提示优化工具有:PromptPerfect15、prompttools16、promptfoo17、

    26、FlowGPT18等,更多相关工具见 LearnPrompting19。13Kojima T,Gu S S,Reid M,et al.Large Language Models are Zero-Shot ReasonersJ.arXiv,2022.14Sahoo P,Singh A K,Saha S,et al.A Systematic Survey of Prompt Engineering in Large Language Models:Techniques and ApplicationsJ.arXiv,2024.15https:/promptperfect.jina.ai/16ht

    27、tps:/ 检索生成增强检索生成增强当大模型处理本地的或特定领域信息时,幻觉、知识过时以及推理过程不透明、不可追踪等问题进一步凸显,不能满足业务实际需求。这就需要在提示中提供更多的专业知识作为上下文背景,确保大模型输出的准确、可靠。检索增强生成技术(Retrieval-Augmented Generation,RAG)20通过整合外部数据库的知识,成为一种高效的解决方案。RAG 通过传统的检索方法,用外部来源的最新信息补充大模型的训练数据,使其不仅能够访问专属知识库,还能动态地引入最新数据,从而引导其生成更准确的回复。一个典型的 RAG 系统流程分为索引、检索和生成:(1)索引:索引首先从不同

    28、格式的文件中提取原始数据,将其转换为统一的纯文本格式。然后,文本被分割成更小的块。最后,使用嵌入模型编码为矢量表示,并存储到矢量数据库中。(2)检索:检索时,系统将用户查询转换为向量表示。然后进行语义相似性检索与问题最相关的前 k 个块。(3)生成:将原始问题和检索到的信息块被合并为提示,一并输入大模型生成最终答案。具体来讲,RAG 系统涉及多个不同的组件,每个组件都需要精心设计和优化,以确保整体性能达到令人满意的水平。索引阶段包括了文档智能解析、文本分块、索引构建与优化、向量嵌入等;检索阶段有检索的理解与优化、检索路由与策略等;生成阶段有重排序、上下文过滤与压缩等。根据上述组件与优化方案的选

    29、择,RAG 可以分为原生、增强、模块 3 种类型21。为进一步提高系统的性能,也会引入后置处理环节,如风控检测、结果缓存、指标监控等。而在生产环境中,则可以根据业务需求在原生 RAG 基础上合理选择扩展组件和优化策略。RAG 类工具有 Jina Reader22、Scrapegraph-ai23、Crawl4AI24等专门为大模型优20Lewis P,Perez E,Piktus A,et al.Retrieval-augmented generation for knowledge-intensive nlp tasksJ.Advances in Neural Information Pro

    30、cessing Systems,2020,33:9459-9474.21Gao Y,Xiong Y,Gao X,et al.Retrieval-Augmented Generation for Large Language Models:A SurveyJ.arXiv,2023.22https:/ Unstructured25、marker-api26、Open Parse27等;支持检索、推荐、过滤等功能的 RAG 检索 API28;有专用数据框架 LlamaIndex29,适用于 RAG 和语义检索的 Haystack30,基于深度文档理解构建的 RAG 引擎 RAGFlow31,也有用于

    31、 RAG 程序搭建的 Verba32;综合开发框架 LangChain33及其衍生低代码平台 Langflow34、Flowise35等;Cohere更推出了专为 RAG 微调优化的大模型 Command R 和 RAG 开发工具包36。2.3.3 智能体智能体智能体(Agent)简单来说可看作能感知环境及需求、进行决策和执行动作的系统。在大模型之前,Agent 主要依赖于规则或强化学习的方法实现。前者容错性较小、后者成本较高,使其无法推广应用到实际的开放环境中。基于大模型的 AI Agent 的核心思想是利用大模型的逻辑推理、工具应用、指令遵循等核心能力,将复杂任务分解为若干相关联的子任务,

    32、并围绕这些子任务制定包含一系列执行动作(Action)的解决方案,进而简化任务难度37,执行复杂推理任务,丰富大模型在实际业务中的应用场景。2023 年 3 月,微软发布 Microsoft 365Copilot,4 月开源项目 AutoGPT38发布,6 月 Lilian Weng 发布“LLM PoweredAutonomousAgents”39,基于大模型的 AIAgent 的重要性逐渐成为业界共识40、41、25https:/ X,Liu W,Chen X,et al.Understanding the planning of LLM agents:A surveyJ.arXiv:24

    33、02.02716,2024.38https:/ Weng.LLM Powered Autonomous Agents.https:/lilianweng.github.io/posts/2023-06-23-agent/40https:/ AIAgent 是一种编排软件,它将大模型、规划能力、记忆、工具结合起来,执行各种任务,例如理解和生成自然语言、从内存中存储和检索信息、利用特定功能的工具,甚至评估自身的表现。核心组件一般包括记忆模块(Memory)、规划模块(Planning)和执行模块(Execution)43。(1)记忆模块主要用于存储智能体与环境的历史交互记录,包括短期记忆和长期记忆

    34、。短期记忆相当于 Transformer 架构约束下的上下文窗口内的输入信息。长期记忆类似于可以根据需要迅速查询和检索的外部向量存储。(2)规划模块赋予智能体类似于人类的解决复杂任务的能力,即将复杂任务分解为一系列简单的子任务,进而逐一进行解决。根据是否接收反馈影响未来行为,可分为无反馈规划和有反馈规划。在无反馈规划中,我们可以采用单路径推理,这种策略将最终任务分解为一系列中间步骤,这些步骤以级联方式连接,每个步骤仅指向一个后续步骤。另一种方法是多路径推理,其中生成的推理步骤被组织成树状结构,每个中间步骤可能有多个后续步骤。此外,还有针对特定领域的长期规划问题的外部规划器,这类规划器基于高效的

    35、搜索算法,提供更可靠的规划能力。有反馈规划则包括从环境、人类和模型中接收反馈,以引导反思和提高规划能力。环境反馈通常采用 ReAct 的推理-行动-反馈模式,明确的推理和行动按顺序进行,如果某个行动的反馈未达到预期结果,则重新进行推理直至得出正确答案。人类反馈,即“人在环中”模式,通过与人类的互动获取反馈,帮助智能体与人类的价值和偏好保持一致,并更好地适应实际环境,同时也有助于缓解幻觉问题。模型反馈则涉及使用大型模型作为质量审核专家,对生成的计划进行评估和改进,引入自我完善机制,通过迭代反馈和改进来提高模型的输出效果。(3)执行模块的目标是将智能体的决策转化为具体结果。它直接与环境互动,决定了

    36、智能体完成任务的效率。具体来说,智能体会在行动决策过程中执行规划组件制定的明确行动规划,同时会参考记忆组件中的长短期记忆来帮助执行准确的行动。在技术实现上,执行组件可以通过大模型自身来完成预定规划,或42https:/www.deeplearning.ai/the-batch/issue-241/43Wang L,Ma C,Feng X,et al.A survey on large language model based autonomous agentsJ.Frontiers ofComputer Science,2024,18(6):1-26.12者通过集成外部工具来增强其执行能力。工

    37、具主要包括 API、外部知识库、第三方模型、大模型自身的内部知识等。最为知名的开发框架是 LangChain,其他框架包括BabyAGI44、AgentGPT45等;多智能体框架 AutoGen46、MetaGPT47等;轻量级框架有 crewAI48、Agently49、phidata50等;可视化工具有 Flowise51、Dify52、Bisheng53、FastGPT54、coze55等。更多相关内容可见 awesome-ai-agents56。补齐了大模型短板的 AI Agent 更具备实用性,将是大模型重要落地方向。但受限于当前技术和市场发展,智能体在记忆与规划上并没有完全成熟,因

    38、此嵌入 RPA(机器人流程自动化)或低代码平台的自动化工作流类智能体成为当前可行的落地方案之一57。如摩根大通推出的 FlowMind 生成系统58,工作流分成 2个阶段。第一阶段为大模型设置上下文、APIs 描述等背景信息,第二阶段则是大模型识别用户查询意图调用相应的工具生成并执行代码。微软 Copilot 则开放测试调用 PowerAutomate,与本地系统集成执行更加复杂的自动化任务59。“AIAgent的工作流程将推动人工智能巨大的进步甚至可能超过下一代基础模型”60。44https:/ Z,Watson W,Cho N,et al.FlowMind:Automatic Workfl

    39、ow Generation with LLMsC/Proceedings of theFourth ACM International Conference on AI in Finance.2023:73-81.59https:/ 模型微调模型微调如 2.3.2 所述,大模型虽然在通用任务上有出色的表现,但在一些细分专业领域,它们往往无法满足专业需求。如果需要让模型在特定领域有更精准、专业的表现,或者需要模型具备特定的知识、能力或风格时,就需要在大模型的基础上进行领域微调。大模型微调是指在预训练的大型语言模型基础上,使用特定领域的数据对其进行进一步的训练。由于大语言模型的参数量巨大,领域微调

    40、环节一般进行参数高效微调(Parameter-efficient Fine-tuning)。这种方法通过只训练模型的一小部分参数,可以在较少的数据和计算资源下实现更好的微调性能。典型的微调方案有 LoRa、适配器微调、前缀微调、提示微调等。大模型微调步骤一般包括基础模型选择、训练数据集的搜集与预处理、微调、测试与评估等。基础模型选择可参考各大模型评测榜单,如 Open LLMLeaderboard61,LMSYS Chatbot Arena Leaderboard62,OpenCompass 司南大模型评测63等。训练数据集的构建则是微调的重要一环。格式化数据集构建主要有以下三种方法64:(1

    41、)基于现有的 NLP 任务数据集构建。这类方法利用已经存在的、经过验证的 NLP 任务数据集,如机器翻译、情感分析、文本分类等。这些数据集通常有明确的标注和结构,可以直接用于微调模型。这种方法的优点是数据质量高,标注准确,能够快速验证模型在特定任务上的性能。(2)基于日常对话数据构建。这类方法使用来源于实际对话的数据,如社交媒体评论、论坛帖子、聊天记录等。这些数据具有多样性和自然性,能够帮助模型适应更广泛的语言使用场景。然而,这些数据往往未经标注,需要进行预处理和标注,以保证数据质量和训练效果。预处理步骤可能包括去除噪声、过滤敏感信息以及标准化对话格式。(3)基于合成数据构建。合成数据是通过生

    42、成模型或规则程序生成的。这种方法适用于特定任务或领域的数据不足的情况。合成数据可以通过数据增强技术、文本生成模型(如 GPT)或者基于规则的方法(如模板生成)来创建。尽61https:/huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard62https:/chat.lmsys.org/63https:/ 和微调都是一种基础大模型在领域应用的重要方法。RAG 在动态环境中表现出色,可提供实时知识更新并有效利用外部知识源,具有很高的可解释性。缺点就是需要从外部数据中实时检索,大模型推理消耗较大,响应速度稍慢,并且最终结果受到检索召回率和准

    43、确率的较大影响。而微调更为静态,可以深度定制模型的行为和风格,更好地适应目标领域。但更新时需要重新训练,并且需要大量的计算资源用于数据集的准备和训练。另外,受到训练数据集的影响可能会过拟合,泛化能力较弱。RAG 最典型的应用场景是 QA 类的智能客服,而微调则适用于知识密度较高、体系较为成熟的专业领域,如医疗、金融、法律类等领域应用。选择 RAG 还是微调,取决于应用环境中对数据动态、定制和计算能力的具体需求。更重要的一点是,提示词工程、RAG、智能体和微调并不相互排斥,而是相互补充,增强对方的强项,抵消对方的弱项,在不同层面上增强大模型的能力。各个技术方案的综合应用是实现贴合场景的高性能业务

    44、 AI 应用的最佳方法。图 2.3.4:RAG 与微调的方案选择652.4 大模型行业应用案例大模型行业应用案例虽然目前生成式人工智能主要应用于面向消费者的产品,但它也有潜力为企业工作流程增加情景感知和类似于人类的决策能力,并彻底改变我们的商业模式。例如,谷歌的客服中心人工智能(CCAI)旨在帮助实现采用自然语言进行客户65Gao Y,Xiong Y,Gao X,et al.Retrieval-Augmented Generation for Large Language Models:A SurveyJ.arXiv,2023.15服务交互,而 NVIDIA 的 BioNeMo 则可以加速新药

    45、的研发。华为盘古气象大模型也已应用于欧洲中期天气预报中心。随着生成式人工智能的不断推广和应用,其产生的深远影响和潜在价值正在加速推动从实验到消费者领域再到企业领域的应用。大模型能否落地一方面取决于大模型的性能,另一方面与所落地行业的特点是分不开的。数据是大模型的基础燃料,这就意味着数据量大、数据质量高、数据多样性强的行业能够为大模型提供充足的训练和微调的数据,而技术需求高、创新能力强、竞争激烈的行业自身就有着拥抱新技术的热情,这些因素决定下,大模型在各国、各行业的成熟度并不一致,在各个应用落地的表现也有所不同。目前,国内外大模型已在办公、教育、医疗、金融、文娱、交通等领域落地应用,从行业渗透率

    46、来看,金融业的渗透率最高,已达 78,在微软、金山办公等龙头企业的带动推广下,在办公领域的渗透率也比较可观,而能源和建筑行业的渗透率较低66。图 2.3 大模型垂直应用行业部署与应用成熟度67在全球,已经有金融行业如 Stripe、Bloomberg;零售行业如可口可乐;生命66钛媒体.2023 中美 AI 大模型应用比较研究报告,http:/ 中美 AI 大模型应用比较研究报告,http:/ Profluent、absci;能源行业如 C3.ai 开始将生成式 AI 应用到内容创建、知识发现、智能客服等场景,引领了行业企业采用新一代 AI 的风潮68。大模型在垂直领域应用的案例不断涌现,以下

    47、作简要介绍,国内外更多的大模型行业应用可见相关文献69、70、71、72、73、74、75、76、77。2.4.1 医药健康医药健康医学方面,ChatDoctor 是一个在 LLaMA 上微调的医学领域大模型78。在相关研究中,研究团队从在线医疗咨询网站“HealthCareMagic”收集了约 10 万条真实的医患对话,并对这些数据进行了人工和自动过滤等预处理作为训练数据。再从在线医疗咨询网站 iCliniq2 收集了大约 1 万条医患对话用于评估模型的性能。对于医疗场景中的问答,研究团队收集并编译了一个数据库,其中包括大约 700种疾病及其相关症状、进一步的医学测试或措施以及推荐的药物治疗

    48、。该数据库可以随时更新,无需重新训练模型。基于此,ChatDoctor 可以检索相应的知识和可靠的来源,以更准确地回答患者的询问。构建完外部知识大脑后,通过构造适当的 prompt 让 ChatDoctor 自主检索其所需要的知识。华南理工大学有一款名为“灵心”的心理陪伴机器人,研究团队构建了超过 15 万规模的单轮长文本心理咨68https:/ AI 而行 共筑新质生产力行业大模型调研报告,http:/ 生成式 AI 白皮书,https:/ AI大模型产业发展报告,http:/ 年),https:/ 中国 AIGC 应用全景报告,https:/ The AI Founder Report B

    49、usiness Impact,Use Cases,Tools,https:/blazpregelj.si/2024-hampton-ai-business-report-uses-tools-and-business-impact/,202477赵鑫,李军毅,周昆,唐天一,文继荣.大语言模型,https:/llmbook-zh.github.io/,2024.78Li Y,Li Z,Zhang K,et al.Chatdoctor:A medical chat model fine-tuned on a large language modelmeta-ai(llama)using medic

    50、al domain knowledgeJ.Cureus,2023,15(6).17询指令与答案,回答数量超过 50 万(指令数是当前的常见的心理咨询数据集PsyQA 的 6.7 倍),并利用 ChatGPT 与 GPT4,生成总共约 100 万轮次的多轮回答数据(SoulChatCorpus-multi_turn),其选择了 ChatGLM-6B 作为初始化模型,进行了全量参数的指令微调,旨在提升模型的共情能力、引导用户倾诉能力以及提供合理建议的能力79。2024 年 5 月,Google 发布了基于 Gemini 模型家族的多模态医学 AI 模型 Med-Gemini,通过自训练微调和网络搜

    51、索集成进行高级推理,通过微调和自定义编码器提高多模态理解,使用推理链进行长文本处理80,在所有可以直接比较的基准测试中都超过了 GPT-4 系列模型。诸多医药公司将人工智能视为核心战略,如制药巨头礼来公司(Eli Lilly and Company)宣布一系列人工智能药物发现合作伙伴关系;诺和诺德(NoNo nordisk)将 AI 视作加速药物开发的潜在关键,自 2022 年以来一直与微软合作构建 AI 模型,一个案例是通过分析研究成功提高了预测个体动脉粥样硬化风险的准确度,并计划利用这些发现来指导心血管疾病治疗靶基因的开发81。2.4.2 金融保险金融保险金融保险领域中,摩根士丹利财富管理

    52、部门开发了一项面向内部的服务,利用 OpenAI 技术和摩根士丹利庞大的智力资本,在几秒钟内将相关内容和见解交付到财务顾问手中,帮助提高效率和规模82。2024 年 5 月,摩根大通(J.P.MorganChase)发布了生成主题投资篮子的人工智能工具 IndexGPT。IndexGPT 使用OpenAI 的 GPT-4 模型和自然语言处理技术,生成与特定主题相关的关键词列表,不仅分析新闻文章来识别参与该领域的公司,并且集成了深度分析功能,用于分析复杂的金融、新闻数据,挖掘潜力公司,帮助客户识别有商业价值的股票,扩展投资视野至非传统企业,制定多样化的主题投资策略83。Visa 和万事达两家金融

    53、服务企业均将最新的人工智能技术应用于欺诈检测方面,预测交易是否合法。保险企业联合健康(UnitedHealth Group)正在使用人工智能和自然语言处理来79https:/ K,Tu T,Weng W H,et al.Capabilities of Gemini Models in MedicineJ.arXiv preprint arXiv:2404.18416,2024.81https:/ 文化教育文化教育文化教育领域中,Legible 将 Open AI 的 ChatGPT 集成到其专有的电子书店搜索引擎中,提供一个全新的方式来访问其目录中的两百万本电子书。LibrarianAI 可用

    54、任何语言流利地交谈,提供快速、友好、全面地响应和建议以及有关图书内容的信息85。Storybird 公司的一个绘本制作平台,只需要输入 1000词以内的提示词,平台就可以生成一本完整的、带有精美插图的故事书。书籍还能上架网站和亚马逊进行售卖。清华大学于 2023 年 9 月 28 日启动“清华大学人工智能赋能教学试点课程工作方案”,AI 智能助教系统使用 GLM 模型为技术底座,通过学科专业资料搭建垂直模型,并辅助知识库,支持个性化学习支持、智能评估和反馈,辅助学生进行深入思考86。北京邮电大学于 2024 年初发布基于讯飞科技文献领域大模型的 AI 科研助手,帮助科研人员进行深入的科研成果调

    55、研并进行智能分析,通过对话方式深入探索文献内容,生成研究文献综述87。国内外数据库产商或学术搜索服务商也都推出了各类 AI 应用助手,如 ScopusAI88、Elsevier SciBite Chat89、CNKI AI 学术研究助手90、SciSpace91、Elicit92、Aminer93、ReadPaper94等。此外,中国科学院文献情报中心与科大讯飞合作研发了科技文献大模型,并基于此模型研发了“成果调研、论文研读和学术写作”三大功能的星火科研助手95。同方知网则与华为共同打造了全栈自主可控的中华知识84https:/ APP 微信读书和得到则在 2024 年上半年灰度上线了 AI

    56、功能。前者提供了翻译、大纲总结和智能问答,后者主要功能是内容总结和智能搜索。文化遗产方面,字节跳动和北京大学合作推出的识典古籍于 2024 年 3 月上线了基于云雀大语言模型开发的“古籍智能助手”。“助手”重点利用检索增强生成技术,利用字典中的条目,或者古籍数据库搜索结果作为上下文,然后通过大语言模型综合总结并给出回复。同时,“助手”也提供语义检索功能,在回答时能参考到虽然文字不一样、但含义相关的古籍段落97。Livdeo 的 MultilingualAudio Chatbots forMuseums and Cultural Institutions 利用 NLP 和 AI 技术,支持访客与

    57、虚拟的历史艺术名人进行多语种的对话,为参观者提供独特的互动体验98。96https:/ 大模型对图书馆的影响第三章 大模型对图书馆的影响3.1 图书馆大模型影响分析图书馆大模型影响分析生成式人工智能的发展可能对图书馆产生“广泛而深刻”的影响。探讨当前大模型技术的能力与影响,有助于在图书馆中应用最新的 AI 技术,为智慧图书馆建设提供新的技术路径和赋能支撑。IFLA 人工智能特别兴趣小组在 2023 年 11 月 20 日发布的图书馆对人工智能的战略响应中指出,新一代人工智能技术对图书馆领域产生了显著影响。报告特别提到了人工智能技术在图书馆中的应用,包括馆藏资源的规模化描述、AI 增强或创建元数

    58、据、智能用户咨询、文献发现服务、后端业务系统的 AI 优化,以及提升公众 AI 素养等方面,对图书馆系统、用户、馆藏、特藏、元数据、设施、推广、培训、策划团队都有重要影响99。大模型被广泛考虑作为多种任务的通用工具,这归功于大模型的核心能力,基于这些能力,大模型能够执行多种任务。为进一步梳理大模型技术的影响,本报告从大模型的核心能力出发,考虑对图书馆行业主要业务具体影响。大模型的核心能力包括语言理解、信息匹配、内容生成、知识承载等基础能力,以及拥有上下文学习、思维链推理、指令跟随等涌现能力100。基于这些能力,大模型能够执行文本生成、语义理解、信息抽取、任务推理、机器翻译、文本分类、总结摘要、

    59、模态转换、数据分析、知识图谱构建等各类任务。大模型的这些功能使得大模型在智能问答、信息检索、个性化推荐和内容生成等场景展现出显著的自动化和智能化优势,从而极大地提升了信息处理的效率和输出的质量,推动了人工智能技术的广泛应用和持续创新。表 3.1 从大模型典型任务能力出发,分析其在图书馆中的作用和影响。通过这些能力的运用,图书馆可以提高服务效率、增强用户体验,并推动图书馆服务的创新和发展。作用影响的图书馆领域包含了参考咨询、资源发现、学术服务、数字人文、阅读推广、图书馆系统、采编、知识加工、管理决策等几个典型领域。这些领域融入大模型的能力,可以满足智慧图书馆中不同类型的需求,包括功能99http

    60、s:/www.ifla.org/g/ai/developing-a-library-strategic-response-to-artificial-intelligence/100上海图书馆(上海科学技术情报研究所)等.智慧图书馆大模型创新与应用白皮书,https:/ 3.1 大模型典型任务功能对图书馆的作用影响大模型典型任务功能大模型典型任务功能作用与影响作用与影响影响领域举例影响领域举例文本生成自动生成各类文档、报告、新闻稿等,辅助图书馆内容创作和信息发布。可用于创作、学习与开发。学术研究、阅读推广等语义理解理解用户查询的深层含义,提供更精准的咨询回复、搜索结果等信息服务。可用于问答式交

    61、互。信息检索、交互问答信息抽取可探索对话式发现,改变图书馆资源检索、资源推荐模式。检索推荐、资源发现等任务推理理解并执行复杂的用户指令,自动化完成特定的图书馆服务任务。图书馆服务平台、后端系统AI 升级、机器流程自动化等机器翻译将不同语言的文献资料进行互译,扩大服务范围和读者群体。可用于多语言文献服务、跨语言阅读。读者服务、文献服务、学术研究等识别分类对图书馆资源进行自动分类、自动标注、元数据创建,优化资源组织和检索效率。采编、数字资源加工与开发、数字人文研究等总结摘要自动生成文献或报告的摘要,帮助用户快速把握核心内容。资源发现、学术研究等模态转换将文本信息转换为图像或视频,增强信息的可访问性

    62、和表达力。可用于多媒体档案保存、内容制作、信息可视化、阅读障碍支持。阅读推广、数字人文等数据分析可进行数据处理、格式转换、报表分析、指标分析、数据挖掘。可在图书馆数据系统、数据中台基础上,构建 AI 数据分析能力,提升运营效率。业务分析、用户行为分析、决策支持等知识图谱构建可构建和维护知识图谱,增强图书馆的知识管理和服务能力。数字人文、知识管理、学术研究、学科服务等22大模型技术对图书馆的影响,主要源于生成式 AI 变革了技术服务模式和内容生产方式,从而带来了三点重要改进。一是人机交互界面的革新推动了图书馆服务场景和业务场景的智能化。生成式 AI 变革了用户与图书馆服务的互动方式,实现了用户界

    63、面的突破,使得用户能更直观、高效地与信息资源互动,提高了信息检索和内容获取的便捷性。大模型能准确理解用户需求,转化为任务,调度资源,最终清晰呈现结果。二是知识管理与服务的智慧化加深促进了图书馆服务模式的创新与变革。生成式 AI 能够实现精准的语义理解和复杂的文本分析,自动化地生成和丰富元数据,构建起揭示知识内在联系的知识图谱,同时提供个性化的信息服务和多模态内容处理,加之其趋势预测与模式识别功能,极大地提升了图书馆在知识组织、存储、检索以及服务提供上的效率和深度,从而深化了图书馆的知识管理与服务。三是任务处理的自动化促进了业务流程优化和工作效率的提升。利用生成式AI 的强大的内容生成和处理能力

    64、,图书馆能够自动化执行繁琐的任务,从而释放人力资源,提升工作效率和服务质量。生成式 AI 技术实现了知识的高效模式转换,能够执行总结、提炼、抽取、萃取、转换、解析和洞察等多种操作,利用现有数据知识生成丰富多样的内容,包括多模态内容。因此,大模型技术的发展对图书馆的变革影响主要体现在以下五个方面,这些变革共同推动了图书馆未来服务模式的转型,为图书馆的发展开辟了新的可能性。(1)革新知识交互方式。)革新知识交互方式。新一轮的 AI 变革,推动未来人机交互应用从图形化界面向对话式交互界面转变。随着大模型的应用落地,图书馆服务可以提供更智能、更高效、更个性化的交互方式,提供基于自然语言的、多模态的、更

    65、直观的参考咨询、文献检索与知识服务。(2)改变知识集成方式。)改变知识集成方式。大模型技术通过自动化生成元数据、跨语言处理、知识链接和语义搜索,显著提升了图书馆知识集成的效率和深度,构建起一个多维度、互联互通的知识网络,从而促进了知识的发现和创新。(3)优化资源加工流程。)优化资源加工流程。大模型技术通过文本图片语音识别、自动元数据生成、自动标注与分类、自动摘要总结、知识图谱构建等,提高了图书资源加工效率,降低人力成本。这将使图书馆资源的标准化加工流程从手动模式向半自动或自动23模式转变,进一步提高图书馆资源加工的效率和质量。(4)激发本地特色资源价值。)激发本地特色资源价值。利用生成式 AI

    66、 技术,对图书馆的古籍资源、地方特色资源等历史文化特色馆藏资源进行开发、挖掘、利用,充分发挥语料价值,增强资源的表现力和吸引力,有效活化典籍知识,弘扬中华经典文化、区域特色文化,激发这些资源的文化影响力。(5)提升图书馆管理决策能力。)提升图书馆管理决策能力。大模型应用可以更好地对图书馆的各项业务数据进行指标监控与分析挖掘,提供科学合理的决策支持,为图书馆业务优化、资源配置提供分析建议,从而提升图书馆的智慧化管理水平和效果,辅助图书馆管理决策更加科学、合理和有效。图 3.1 大模型技术对图书馆的影响3.2 图书馆大模型应用策略图书馆大模型应用策略在深入思考图书馆大模型应用之前,有必要探讨生成式

    67、 AI 的应用策略及应用方式。国际图联(IFLA)在其图书馆对人工智能的战略响应中,提出了三项策略建议,旨在指导图书馆如何有效利用 AI 技术,提升服务效能,同时确保其应用的伦理性和可解释性。三项策略分别是:利用图书馆的 AI 能力构建负责任且可解释的描述性 AI 应用;利用图书馆员的数据能力增强组织的 AI 能力;24推广人工智能素养以提升组织和社会的 AI 能力101。此外,美国国会图书馆(Library of Congress,简称 LC)提出了 AI 规划框架,强调了在 AI 系统中数据、模型和人员三个要素的重要性,并提出了“理解、实验和实施”分阶段的方法论,以实现负责任的 AI 实践

    68、102。图书馆可在上述权威性 AI 应用策略的指导下进行实践,本报告归纳了如下的策略要点供图书馆进行参考:(1)考虑馆藏与数据价值)考虑馆藏与数据价值对图书馆数据与资源进行分析,以识别和评估潜在的数据源,特别是对于古籍和特藏,明确可以优先应用 AI 技术的数据。高度重视数据治理,包括数据清洗、集成和质量保证,确保数据的准确性和可靠性。推广数据共享、开放性和互操作性。(2)进行概念验证与服务转化)进行概念验证与服务转化实施小规模的概念验证项目,以测试生成式 AI 技术在图书馆服务中的可行性。对于技术挑战(例如图像分类等)开发或整合高效的 AI 算法,提升处理的精确度。成功的概念验证项目应转化为可

    69、持续的服务,以实现技术的长期价值。(3)持续监控与质量保证)持续监控与质量保证建立监控机制,根据反馈持续改进 AI 服务,确保服务质量。考虑使用数据为中心的评估方法,通过科学地评估和测试,确保 AI 系统的稳定性和可靠性。以迭代、循环的方式,长期优化、监控应用。建立质量标准基线,搜集用户反馈。(4)积极培训与社区参与)积极培训与社区参与提升图书馆员工和用户的 AI 素养,并通过社区反馈优化服务。支持并参与图博档机构合作、行业机构联盟,以开放、共享、创新、合作为核心要素,整合来自不同机构的独特资源和专业知识。(5)做好经济性与工具评估)做好经济性与工具评估对 AI 技术应用进行成本效益分析,确保

    70、所选工具和解决方案在预算内提供最大的价值。评估不同 AI 工具的性能,选择那些能够最大化投资回报率的工具。(6)关注法律与伦理框架)关注法律与伦理框架确保 AI 应用遵守所有相关的法律法规,特别是在数据保护、版权和知识产101https:/www.ifla.org/g/ai/developing-a-library-strategic-response-to-artificial-intelligence/102https:/blogs.loc.gov/thesignal/2023/11/introducing-the-lc-labs-artificial-intelligence-plann

    71、ing-framework/25权方面。建立伦理审查流程,确保 AI 应用不会侵犯个人隐私,避免算法偏见和歧视。3.3 图书馆大模型应用路径图书馆大模型应用路径图书馆应根据领域(场景)特定需求,探索大模型应用方式与路径,以促进服务优化和提升读者体验。我们鼓励图书馆与软硬件供应商合作,逐步将生成式AI 技术应用于智慧图书馆中,以实现图书馆服务业务的智能化升级。本报告归纳了图书馆整合和应用生成式 AI 技术的六种方式路径。(1)无需开发集成的)无需开发集成的 AI 服务:服务:图书馆无需进行任何开发工作,重点放在AI 素养、数据素养等相关内容培训。这种方式不需要图书馆参与技术应用开发,而是侧重于通

    72、过馆员组织培训、活动等方式向用户和社会提供 AI 服务。该路径无需系统开发、无需数据处理。(2)直接集成应用的)直接集成应用的 AI 产品工具:产品工具:图书馆几乎不需要进行开发工作,可以直接集成第三方提供的 AI 产品服务。这种方式主要依赖于第三方 AI 产品的性能和适用性,为图书馆直接所用。例如不少图书馆上线资源商开发的 AI 学术助手产品,以及为图书馆用户提供现成的 AI 画图工具等。该路径可以直接购买服务,开发量低、几乎无需数据处理。(3)需整合开发的)需整合开发的 AI 产品与服务产品与服务:图书馆通过有限的开发工作,实现已有AI 产品的对接。该应用方式下,图书馆需要对运营数据、服务

    73、数据、资源数据等进行一定程度的适配和优化,以确保 AI 产品与图书馆平台服务无缝集成。例如基于图书馆资源与服务的智慧咨询、增强检索、智慧推荐等。该路径侧重于前端服务升级,以及可能的后端轻量化改造。该路径有一定的开发工作量,一定量的数据处理任务。(4)集成定制开发的后端)集成定制开发的后端 AI 流程:流程:图书馆通过集成定制,进行后端业务流和系统的智能升级。通过在后端业务中融入大模型技术,基于图书馆的运营数据、服务数据、资源数据进行分析、处理,提供 AI 支持的结果展现、建议决策等。例如后端系统中的自动编目与元数据生成,辅助数字资源的加工与开发,图书馆服务平台(LSP)副驾驶等。该方式面临着较

    74、大的开发工作和数据处理任务。(5)自主)自主/联合开发的联合开发的 AI 原生应用:原生应用:图书馆利用自身馆藏数据、用户数据,投入资源,开发新型前后端的 AI 原生应用。此类应用需要对图书馆资源数据进26行清洗、标注、处理等工作,以确保数据质量和应用的准确性。通过这些原生应用的开发,图书馆将能够提供具有行业特色和个体特色的个性化的智能应用。该路径开发工作量大,数据处理任务重。(6)参与研发行业基础大模型:)参与研发行业基础大模型:图书馆参与到行业基础大模型的研发过程中。图书馆利用其丰富的文献资源和专业知识,与技术合作伙伴共同构建大规模语料库,为模型训练提供数据支持。此外,图书馆参与到行业大模

    75、型的设计、开发和优化工作中,确保所研发的行业大模型产品能够满足图书馆行业落地应用需求。该路径需要深度的数据准备和技术研发能力。图 3.3 图书馆大模型应用的六种路径举例上述六种图书馆大模型应用路径,在实现难度、资源需求、技术依赖性上从易到难,预计图书馆将以符合现有角色、与用户需求紧密相关或需要最少资源的方式来应用人工智能。对于路径 1,在推广人工智能素养方面发挥领导作用,是当前最符合现有图书馆实践和图书馆员身份的策略。对于路径 2-5,在实施负责任的 AI 应用时,建议大多数图书馆基于 MasS 服务模式,选择成熟的基础大模型作为应用底座进行应用。对于路径 6,要求图书馆具备一定的资源能力、技

    76、术能力或研究能力。例如瑞典国家图书馆案例,图书馆训练了多个瑞典语模型提供服务103。图书馆也可考虑与外部合作,例如国家图书馆目前就已与百度展开战略合作,携手文心一103https:/ AI 服务的图书馆,可以考虑从集成第三方 AI 服务开始,逐步积累经验和技术能力。对于具有较强技术实力和研究背景的图书馆,可以考虑自主研发或联合开发 AI服务产品,以实现更高水平的创新和服务质量提升。其次,深入的需求分析是确保 AI 应用能够切实解决问题、提升服务体验的前提。此外,风险评估与管理是保障 AI 应用稳健性的重要环节,图书馆需制定相应的风险管理策略,以应对潜在的技术风险和道德挑战。为了适应技术的快速发

    77、展,图书馆还需制定长期的AI 技术发展规划,以保持其服务的前瞻性和竞争力。3.4 图书馆大模型应用范式图书馆大模型应用范式图书馆通过上述六种实施路径,在 AI 应用策略方针的指导下,成功地运用并实施生成式 AI 技术,以此深入智慧图书馆的转型。这一转型主要体现在两种主要的应用方向。一方面,图书馆通过优化现有工作流程,将传统的应用通过集成 AI 技术进行重塑,提高了服务质量和流程效率;另一方面,图书馆开创开发AI 原生应用,推动图书馆服务智能化跨越式发展。这正对应了智慧图书馆大模型创新与应用白皮书中“智慧图书馆+大模型”“大模型+智慧图书馆”两种不同的应用范式105。传统应用的传统应用的 AI

    78、重塑:重塑:这一类别中,传统的图书馆应用通过集成 AI 技术得到增强、优化、重塑,从而提高服务质量和流程效率。例如员工知识库的智慧升级、AI 辅助的采编流程、数字资源的加工与开发等,通过优化现有工作流程,提升了馆员的工作效率。此应用方向体现了以图书馆业务场景为核心,通过接入大模型的智能化能力实现服务和效率的双重提升,即“+大模型”的应用范式。104https:/ AI 原生应用:原生应用:关于原生应用这一概念并没有准确的定义,仍存在不同的理解。本报告中认为大模型原生应用即那些将大模型技术作为核心功能和价值支撑的应用。这一类应用直接根植于生成式 AI 技术最核心的能力,如提供个性化服务和内容创新

    79、创造。典型的原生应用例如智能聊天机器人、AI 写作助手、多模态创作工具等,为图书馆的内容服务带来创新动力;比较具有行业典型性的AI 原生应用如:AI 研究助手、个性化学术教练等,为用户提供定制化的信息和学术支持。路径 5 中“自主/联合开发的 AI 原生应用”,可兼具行业的典型性及图书馆个体的特色性。随着 AI 技术的不断发展,越来越多的原生应用将被开发应用,智慧图书馆中的大模型应用则逐渐由“+大模型”向“大模型+”范式转变。当然,原生应用中还包括了智未触及的智未触及的 AI 应用领域应用领域。尽管当前尚未广泛实现,但前景广阔,这类应用代表着未来的颠覆性创新。例如包括基于智能体的流程自动化、具

    80、身智能应用以及高智能 AI 员工等概念。这些潜在应用有望进一步扩展图书馆的服务范围,实现服务的自动化和个性化,为图书馆带来前所未有的发展机遇。图 3.4图书馆“+大模型”与“大模型+”应用范式293.5 图书馆大模型技术架构图书馆大模型技术架构为实现图书馆大模型的应用,需要对现有信息化基础架构进行扩展,建立适应大模型应用需求的技术架构,包括底座、模型、平台和应用等方面,旨在提供高度扩展性和集成性,以满足图书馆的发展和创新需求。图书馆大模型应用可基于现有信息化基础架构进行扩展,满足大模型应用需求,包括底座、模型、平台和应用等方面,旨在提供高度扩展性和集成性,以满足图书馆的发展和创新需求。图 3.

    81、5 图书馆大模型技术架构(1)底座层:硬件方面要考虑 GPU 或 CPU 设备,还要关注最新的硬件进展。例如,NVIDIA 的 TensorRT 是一个为深度学习推理优化的软件库,而 Intel的 OpenVINO 则提供了跨不同硬件的 AI 推理优化。在选择云端或本地部署时,有华为、腾讯、阿里等供应商,还需综合考虑其他因素,如成本、安全性、可用性等。公有云服务如 Azure、AWS 提供的容器服务和 Kubernetes(K8S)可以用于实现资源的弹性伸缩和智能调度。(2)模型层:大模型的部署不仅限于云端或本地,还应考虑模型即服务(MaaS)的兼容性。MaaS 模式涉及模型的全生命周期管理,

    82、从数据处理到特征工程,再30到模型训练、调优和部署。此外,模型服务还包括 API 和开发工具,以便于开发者和企业能够快速集成和使用大模型。大模型的发展和应用正在不断扩展,包括在多任务、多数据类型或多领域中的使用。云端大模型的提供商需要遵守相关的管理办法,如生成式人工智能服务管理暂行办法。(3)平台层:平台层的设计应支持与现有图书馆服务平台、数字人文平台等的集成,并能够通过 API 网关与各类信息化应用对接。模块化的大模型应用框架,如 Langchain、Dify 和 FastGPT,提供了易于扩展和定制的能力。运维工具如 LangSmith 和 PromptLayer,监控工具如 arize、

    83、fiddler 和 Helicone,以及防火墙如 arthur shield,都是平台层的重要组成部分,确保大模型应用的稳定性和安全性。(4)应用层:应用层的设计应包含应用框架和数据管理,提供应用级的基础组件。例如,LangChain 提供了一个用于构建和部署大模型应用的框架。数据管理工具如 LlamaIndex 和 MindsDB,可以帮助组织和检索大量的结构化和非结构化数据。向量数据库如 chroma、Milvus 和 Weaviate,对于处理和索引大规模的向量数据尤其重要。此外,应用和工作流工具如 Retool、Streamlit 和 gradio,可以用于快速开发和部署基于大模型的

    84、应用程序。根据当前阶段图书馆领域大模型应用的共性特点,我们在图书馆大模型应用架构的应用层中需要设计和规划一系列基础功能,以满足多样化的图书馆服务需求。这些功能组件包括智能问答、知识库管理、资源推荐、自动标引与分类、文本内容生成、图像和多媒体处理、数据处理与分析,以及工作流编排和管理等。通过构建这些功能组件,我们能够实现功能的模块化和复用,从而提高系统的灵活性和管理效率,以满足不断演化的图书馆服务需求。31第四章 智慧图书馆中的大模型应用第四章 智慧图书馆中的大模型应用图书馆应积极关注并推动生成式 AI 的创新应用和场景落地,尤其要关注大模型技术如何有效提升服务成效和服务质量。虽然大型模型技术仍

    85、在持续迭代,生成式 AI 技术也在不断发展之中,但图书馆可以积极思考挖掘大模型技术在智慧图书馆中的应用潜力,提出需求期望,引导技术厂商开发实践,把握住未来发展的主动权。智慧图书馆大模型创新与应用白皮书中指出,智慧图书馆大模型应用将主要体现智慧服务、智慧业务、智慧管理、智慧空间四个方面106。根据当前技术发展现状,下文重点梳理智慧图书馆建设中,那些当前可实验、实施或展望的AI 应用。图 4.0 智慧图书馆中的可实验、实施或展望的大模型应用106上海图书馆(上海科学技术情报研究所)等.智慧图书馆大模型创新与应用白皮书,https:/ 智慧服务中的大模型应用智慧服务中的大模型应用大模型技术赋能了图书

    86、馆的传统服务,并驱动了图书馆的新型服务,进而推动智慧服务的创新发展。大模型技术应用在智慧服务中主要集中在增强客户体验,体现在如下几个领域:一是智慧读者服务的智能升级。一是智慧读者服务的智能升级。通过自然语言处理技术提供智能问答服务、个性化推荐等,带来读者服务中的咨询问答、检索发现、资源推荐的智能升级。这些应用已经开始由图书馆厂商开发并逐步推向市场。二是学术与专业服务的新范式。二是学术与专业服务的新范式。大模型将散落在信息海洋的特定知识片段连接起来,并进行推理、分析、对比、归纳,为知识服务铸造新的价值,为研究者提供个性化的学术辅助和服务,促进形成学术服务、专业服务、情报服务、教学与学科服务的新范

    87、式。以“学术助手”“AI 助教”为典型的应用产品也已在市场推出。三是驱动图书馆创新服务。三是驱动图书馆创新服务。通过激活自有数据价值,结合元宇宙等新技术,图书馆能够提供更加沉浸式的阅读体验,促进知识的互动传播,从而在人文服务领域开辟新的前沿。这类应用目前主要体现在结合特藏的 AI 数字馆员服务、AI阅读产品创新体验、AI 知识服务等领域。针对智慧服务中上述重点领域,对大模型应用目标及应用建议等简要梳理如下107。(1)传统服务赋能领域)传统服务赋能领域 1:智慧咨询服务目标:智慧咨询服务目标:使用大模型为读者提供准确、实时的信息咨询服务。模型能力:模型能力:问答对话、搜索/信息抽取等建议:建议

    88、:结合多知识库、支持不同的读者服务部门。读者可以自助进行图书馆咨询问答,问答内容可包括:图书馆政策服务问答指导,结合业务系统的图书资源咨询、活动咨询、用户使用咨询、使用故障解决等。技术方案技术方案:提示词工程、RAG、智能体应用路径应用路径:需整合开发的 AI 产品与服务领域领域 2:智能检索与发现智能检索与发现107注:本章中所呈现的目标设定、应用建议、模型能力、技术方案、应用路径旨在提供参考,并非唯一确定的解决方案。33目标:目标:运用大模型帮助读者快速、准确地发现和检索到他们所需的信息和资源。模型能力:模型能力:问答对话、搜索/信息抽取等建议:建议:支持图书馆采购的所有纸质资源、电子数据

    89、库、自建数据库的智能检索与发现。引入智慧增强功能,优化检索过程,借助自然语言处理和多轮对话系统,使读者能够以更直观、更高效的方式来发现馆藏的纸质和数字资源。技术方案技术方案:提示词工程、RAG、智能体应用路径应用路径:需整合开发的 AI 产品与服务领域领域 3:个性化智能推荐目标:个性化智能推荐目标:通过大模型技术,为读者提供全新智能化的书籍和资源推荐。模型能力:模型能力:问答对话、搜索/信息抽取、数据分析等建议:建议:利用大模型优化原先的资源关联推荐算法,优化个人主动推荐功能与算法。改变当前读者个性化推荐的交互形式,改善用户对馆藏的访问。整合现有图书资源数据、自建资源、整合出版社新书数据、公

    90、信力书单数据,构建跨库跨模态的图书馆专用的资源推荐知识库。整合图书馆数据库介绍、数字资源介绍,构建数据库推荐知识库。技术方案技术方案:提示词工程、RAG、智能体应用路径应用路径:需整合开发的 AI 产品与服务领域领域 4:智慧学术服务目标:智慧学术服务目标:利用大模型对海量学术文献进行深度分析和处理,提供深度学术研究支持。模型能力:模型能力:问答对话、搜索/信息抽取、文本理解、机器翻译、数据挖掘、数据分析、文本生成等建议:建议:通过大模型技术,提供问答式智能检索、学术文献推荐、深入挖掘学术资源,发现潜在的研究方向和创新点,帮助实现个人文献管理与知识研究智能化,协助文献综述、数据分析和解释等。支

    91、持图书馆购买的现有电子数据库,无论数据库供应商是否提供 AI 相关功能。改进图书馆学科领域的特色专题服务,提供基于学科领域的数据分析、知识图谱问答服务。技术方案技术方案:提示词工程、RAG、智能体34应用路径应用路径:直接集成应用的 AI 产品工具、需整合开发的 AI 产品与服务领域领域 5:智慧情报服务目标:智慧情报服务目标:运用大模型提供更加丰富、智慧的情报服务产品。模型能力:模型能力:问答对话、搜索/信息抽取、文本理解、机器翻译、数据挖掘、数据分析、文本生成等建议:建议:大语言模型推动情报的采集、处理、分析及服务流程发生改变,使情报服务更加自动化、智能化。例如提供即时、精准、智慧的情报咨

    92、询服务,满足用户个性化的信息需求。智能深入分析情报内容,揭示深层次的洞见。提供智慧分析工具、文献阅读、文献问答等服务。利用文本生成技术自动编制情报报告,提升服务效率。技术方案技术方案:提示词工程、RAG、智能体应用路径应用路径:直接集成应用的 AI 产品工具、需整合开发的 AI 产品与服务领域领域 6:智慧教学与学科服务目标:智慧教学与学科服务目标:针对高校图书馆未来学习中心建设要求,运用大模型技术提升教学与学科服务的智能化水平,以实现个性化学习和研究支持。模型能力:模型能力:问答对话、搜索/信息抽取、文本理解、机器翻译、数据分析、文本生成等建议:建议:提供 AI 学习助手,增强个性化学习路径

    93、规划、互动式学习体验、学习效果评估、学习资源推荐。促进跨学科知识融合,支持复杂问题求解。快速响应师生的学术咨询,提升研究效率。探索基于数据驱动的教学质量分析,为教学方法改进提供决策支持。技术方案技术方案:提示词工程、RAG、智能体、模型微调应用路径应用路径:直接集成应用的 AI 产品工具、需整合开发的 AI 产品与服务、集成定制开发的后端 AI 流程、自主/联合开发的 AI 原生应用(2)创新服务驱动领域)创新服务驱动领域 7:虚拟人、数字人、虚拟人、数字人、AI 数字馆员数字馆员35目标:目标:整合大模型技术,使虚拟人和数字人成为图书馆服务的重要力量,以提升用户体验感。模型能力:模型能力:问

    94、答对话、搜索/信息抽取、语音识别与合成等建议:建议:利用虚拟人和数字馆员实现 24/7 在线咨询服务,提供及时且准确的信息查询、阅读辅助;结合特藏资源,提供 AI 解析与内容服务;结合阅读推广服务,运用它们举办多样化的阅读推广活动,增加自由资源的可见度,增加读者的参与度。引入 AI Agent 业务流编排,使得虚拟人具有设定专业能力从而向 AI 数字馆员升级。技术方案技术方案:提示词工程、RAG、智能体应用路径应用路径:直接集成应用的 AI 产品工具、需整合开发的 AI 产品与服务领域领域 8:智慧创新阅读与体验目标:智慧创新阅读与体验目标:利用大模型为广大读者提供新颖、智慧的新型阅读体验服务

    95、。模型能力:模型能力:问答对话、搜索/信息抽取、文本生成、图像与语音识别、多模态创作等建议:建议:需要开拓创新。除了引入 AI 阅读工具辅助文献阅读外,可重点结合阅读推广服务,开发 AIGC 创新型阅读体验,例如基于特色馆藏的 AIChatbot,融入AI 的场景游戏,读者多模态创作体验,利用 AI 增强元宇宙沉浸式阅读的互动性等。技术方案技术方案:提示词工程、RAG、智能体应用路径应用路径:直接集成应用的 AI 产品工具、需整合开发的 AI 产品与服务、自主/联合开发的 AI 原生应用领域领域 9:数据与知识服务产品目标:数据与知识服务产品目标:发挥图书馆专有数据、基础数据设施优势,构建全新

    96、 AI 数据服务、知识服务、模型语料提供等,提高知识的传递能力。模型能力:模型能力:问答对话、搜索/信息抽取、文本图像识别、知识图谱理解与构建、内容生成等36建议:建议:需要开拓创新。结合图书馆丰富的历史档案、历史文献、古籍资源,创新数字人文服务,为用户提供智慧的历史人文阅读分析平台、可视化交互平台。另一方面,尝试语料库建设,开发专有领域模型训练语料库、知识库产品,开发中间层和应用层产品,通过跨界合作、资源整合、服务对象拓展,提供基于 AI 的人文知识服务、深度解析服务、艺术及文学作品溯源服务,提供诸如古籍 AI 解读、AI 碑帖识别、历史人/物识别、人文 AI 创作体验服务等。技术方案技术方

    97、案:提示词工程、RAG、智能体、模型微调应用路径应用路径:需整合开发的 AI 产品与服务、自主/联合开发的 AI 原生应用、参与研发行业基础大模型4.2 智慧业务中的大模型应用智慧业务中的大模型应用随着 AI 技术的持续进步,智慧图书馆的业务流程中,将越来越多地体现人机共存和人机互补的理念,这将成为图书馆智慧业务中大模型应用的重要趋势。一是自动化与智能化图书馆业务流程一是自动化与智能化图书馆业务流程。利用大模型技术,图书馆可以自动化执行采编、资源加工、知识组织等核心业务流程。这不仅包括自动分类和编目,还可以扩展到智能内容审核、智能资源盘点、个性化推荐系统等,从而大幅提升图书馆的运营效率和服务质

    98、量。二是历史文献的数字化与深度利用二是历史文献的数字化与深度利用。大模型技术可以支持图书馆对历史资料和文献进行高效的数字化处理,包括保存、修复、识别、评估、分类、开发等。通过结合各类技术,图书馆能够深入挖掘历史文献的价值,为学术研究和文化传承提供丰富的原始资料和深度分析。三是专业研究中的智能化辅助。三是专业研究中的智能化辅助。大模型技术能够为情报馆员、专业研究馆员、古籍历史学家提供强大的研究支持,包括但不限于智能检索、趋势分析、学术网络构建等。此外,大模型还可以辅助构建知识图谱,将分散的信息点连接成系统化的知识体系,为专业研究提供更为丰富和深入的学术环境。针对智慧业务中的重点领域,对大模型应用

    99、目标及应用建议等简要梳理如下。领域领域 10:智能采编目标:智能采编目标:利用大模型提高图书馆采访和编目的效率和质量。37模型能力:模型能力:语义分析、文本分类、信息抽取、实体识别、自动化元数据生成、数据分析等建议:建议:智能分析采访目录,结合推荐系统,基于馆藏现状、读者需求、馆员要求,为图书馆提供动态采购建议。自动识别书籍等资源的元数据,减少人工输入的需求。自动或半自动完成书籍的编目工作,提高工作效率。支持跨应用的交互、数据比较和分析,解放馆员的重复工作。技术方案技术方案:提示词工程、RAG、智能体、模型微调应用路径应用路径:集成定制开发的后端 AI 流程、自主/联合开发的 AI 原生应用领

    100、域领域 11:智能数字资源加工目标:智能数字资源加工目标:利用大模型技术提高数字资源加工的效率与质量,确保资源的高效管理和知识的持续传承。模型能力:模型能力:文本识别、图像识别、语音识别、自然语言处理、机器翻译、自动化元数据生成、格式迁移、数字恢复、数据分析挖掘等建议:建议:提供辅助数字资源保存、加工、分析的系列工具或功能,包括文本资源加工开发、多媒体资源加工开发。例如:文本识别、图片识别、数据转换、格式转换、机器翻译等。采用 AI 进行数字内容的格式迁移和规范化,以适应数字保存不断变化的技术标准。对数字化的文献和多媒体资源进行智能识别和分类,自动提取关键信息进行标注,可自动分类编目、自动元数

    101、据生成。此外,还能实现图像的自动标引、描述与分类,以及音视频内容的提取分析与自动分类。采用面部和物体识别技术,增强视觉材料的元数据标记,提升检索效率。采用先进的 AI技术,识别和修复损坏或退化的数字文件,以保障资源的完整性、提升媒体内容的质量108。技术方案技术方案:提示词工程、RAG、智能体、模型微调应用路径应用路径:需整合开发的 Al 产品与服务、集成定制开发的后端 AI 流程、自主/联合开发的 AI 原生应用领域领域 12:古籍与数字人文智慧研究:古籍与数字人文智慧研究108https:/www.ifla.org/news/webinar-ai-and-the-future-of-dig

    102、ital-preservation-call-for-proposals/38目标:目标:运用大模型辅助图书馆馆藏数字化和数据基础设施的建设,提升图书馆数字人文研究和服务的质量与效率。模型能力:模型能力:语义分析、机器翻译、文字识别、图像识别与处理、知识图谱构建、问答对话、搜索/信息抽取、数据分析等建议:建议:提供一系列独立或嵌入式数字人文工具,供研究者和开发者在各种环境中使用。如元数据分析清洗、数据摘要、知识图谱生成、纪年转换、古今地名转换、情感分析、时空分析、AI 图像修复、AI 古籍修复等。嵌入数据分析工具、可视化工具,提供遥读工具与智慧洞见交互工具。并能以特色自有资源为源泉,补充外部基

    103、础数据,构建、开发图书馆特色的历史人文专题特色资源知识库的 AI 知识服务应用与产品。技术方案技术方案:提示词工程、RAG、智能体、模型微调应用路径应用路径:需整合开发的 Al 产品与服务、集成定制开发的后端 AI 流程、自主/联合开发的 AI 原生应用、参与研发行业基础大模型领域领域 13:智慧学术研究、情报研究目标:智慧学术研究、情报研究目标:借助大模型协助馆员进行学术学科研究、情报分析,提供一个集成 AI 功能工具的知识研究助手或研究环境。模型能力:模型能力:文本分析与理解、搜索/信息抽取、信息整合、机器翻译、数据分析与挖掘、知识图谱构建等建议:建议:基于机构的数据湖、数据仓、知识数据中

    104、台等,集成增强检索、选题分析、文献推荐、文献分析、数据处理、数据分析、内容生成、审稿检查等智能辅助工具,在学术研究和情报分析中的各个环节为馆员提供支持,为图书馆专业服务馆员、情报服务馆员建立智慧的专业研究环境。技术方案技术方案:提示词工程、RAG、智能体应用路径应用路径:直接集成应用的 AI 产品工具、需整合开发的 Al 产品与服务、集成定制开发的后端 AI 流程、自主/联合开发的 AI 原生应用4.3 智慧管理中的大模型应用智慧管理中的大模型应用39大模型应用于图书馆智慧管理,在于为馆员员工提供智慧化的工具和平台支持,以及提升管理决策的科学性水平。当前可以尝试实践的方式主要是以助手工具、集成

    105、式助手平台来为图书馆中的各类管理(包括业务管理),提供工具性的支持,包括:一是提供馆员知识库的智慧升级一是提供馆员知识库的智慧升级。用大模型构建内部知识库问答系统,实现馆员间高效的知识共享和业务沟通。二是提供数据分析类的数智助手。二是提供数据分析类的数智助手。用大模型加强图书馆在数据处理与分析方面的能力,提升图书馆智能决策水平。三是为图书馆平台提供副驾驶。三是为图书馆平台提供副驾驶。旨在通过智能化辅助工具优化整个业务流程的管理。该应用通过自动化和智能化的场景调度,优化图书馆后台管理流程,从而提升操作效率。四是提供集成式的应用与助手工具平台。四是提供集成式的应用与助手工具平台。包含如写作助手、多

    106、模态助手、业务培训助手等等大模型的创新工具应用,以辅助图书馆中的办公与运营,提高工作效率。领域领域 14:馆员知识库升级目标:馆员知识库升级目标:利用大模型构建内部知识库问答系统,实现馆员间的高效知识共享和业务沟通,提高处理业务的效率和准确性。模型能力:模型能力:文本分析与理解、搜索/信息抽取、问答对话等建议:建议:构建跨部门协作的内部知识管理及问答系统,使馆员能够独立进行图书馆相关的咨询和问答操作。支持对数据交流的询问,覆盖不同类型馆藏资源。通过整合 API 调用现有应用系统的能力,能够将返回的结果融入到回答中,为馆员提供全方位且精准的信息支持,确保信息的准确性和可靠性。技术方案技术方案:提

    107、示词工程、RAG应用路径应用路径:直接集成应用的 AI 产品工具、集成定制开发的后端 AI 流程领域领域 15:智慧分析与智能决策目标:智慧分析与智能决策目标:通过大模型技术,加强图书馆在数据分析及智能决策方面的能力,提升服务质量与管理效率。40模型能力:模型能力:数据清洗、数据格式转换、数据分析、数据挖掘、预测分析、可视化展示等建议:建议:可开发并集成一个数智助手,支持数据分析、数据处理、格式转换、格式迁移、自动报表、智能问答等功能,以支撑图书馆在数据驱动决策方面的需求。数智助手可提炼数据概要,辅助策略制定,优化服务与资源管理。还可以通过趋势预测与模式识别,辅助图书馆能够精准捕捉用户需求,动

    108、态调整资源配置,提高服务质量,提升图书馆智慧分析与智能决策水平。有条件的图书馆可建设基于数据中台的 AI 中台。技术方案技术方案:提示词工程、RAG、智能体应用路径应用路径:直接集成应用的 AI 产品工具、集成定制开发的后端 AI 流程领域领域 16:图书馆平台管理副驾驶(图书馆平台管理副驾驶(Copilot)目标:)目标:通过大模型技术,为图书馆馆员打造一个基于图书馆平台系统的智能化的辅助工具,通过自动化和智能化场景调度后台管理流程,以提高操作效率、并增强决策支持能力。模型能力:模型能力:自然语言理解、自动化任务处理、问答对话、数据分析、决策支持等建议:建议:实现一个集成的后台管理副驾驶模块

    109、,具备以下关键功能:负责整合馆员当前使用的多个信息系统后台,确保所有主要服务接口能够统一接入,便于客户端使用,并实现业务流程的自动化组合操作。可问答查询全面展示各系统各资源的使用情况,调用数智助手,自动生成并可视化展示统计分析报告,支持历史数据的深入分析和趋势比较。图书馆平台管理副驾驶不仅提升了图书馆内部管理的智能化水平,也优化了对外服务的响应速度和质量,成为图书馆智慧管理的核心组成部分。技术方案技术方案:提示词工程、RAG、智能体应用路径应用路径:集成定制开发的后端 AI 流程、自主/联合开发的 AI 原生应用领域领域 17:智慧办公与运营协助目标:智慧办公与运营协助目标:为图书馆员工在宣传

    110、、推广、人事、财务等各自日常工作领域中提供 AI效率工具。41模型能力:模型能力:自然语言理解、知识检索与整合、文本生成与创作、多模态创作、机器翻译、数据处理、数据分析等建议:建议:为馆员提供集成式的助手工具平台,覆盖文案创作、语言翻译、多模态内容生成等关键功能,旨在各工作环境中提高图书馆员工效率。该平台将提供先进的写作、宣传助手服务,包括自动生成、修订及翻译文本;提供多模态工具助力制作和编辑图像与视频内容;提供 AI 支持的培训、财务、后勤。通过技术促进员工工作效率和工作质量的提升。技术方案技术方案:提示词工程、RAG、智能体应用路径应用路径:直接集成应用的 AI 产品工具、集成定制开发的后

    111、端 AI 流程4.4 智慧空间中的大模型应用智慧空间中的大模型应用智慧图书馆中的智慧空间主要因素包括有场馆、座位、建筑、设施设备、活动等,虚拟空间也可以作为智慧空间的一部分109。大模型技术在智慧图书馆空间的应用,当前可尝试领域的包括:一是通过智能化手段优化实体空间服务一是通过智能化手段优化实体空间服务。例如进行机器人咨询、导航、盘点、无障碍服务、空间预约等,全面提升了图书馆空间的运营效率和用户服务体验,推动了图书馆服务的智能化转型。二是利用二是利用 AI 技术拓展虚拟空间服务。技术拓展虚拟空间服务。通过虚拟助手、数字人、元宇宙交互等创新应用,实现虚实融合的智慧体验。图书馆能够提供更加丰富多元

    112、的沉浸式服务,增强用户互动性和体验感。领域领域 18:智慧预约服务目标:智慧预约服务目标:整合大模型技术,实现图书馆空间和资源的智能预约管理。模型能力:模型能力:任务理解、资源优化分配、自动化工作流程等建议:建议:利用自然语言理解处理用户预约请求,预测用户需求,智能推荐空间和时间选项。系统应能自动调整资源分配,优化空间使用,并提供自动化的确认和提醒服务,减少人工干预,提高预约流程的效率和用户便利性。技术方案技术方案:提示词工程、RAG、智能体应用路径应用路径:需整合开发的 AI 产品与服务、集成定制开发的后端 AI 流程109刘炜,赵冬梅.图书馆智慧空间建设:概念、演变、评价与设计J.图书情报

    113、工作,2022(01):122-13042领域领域 19:实体机器人目标:实体机器人目标:利用大模型提升图书馆服务机器人的功能,使其能更好地辅助图书馆的日常运营和服务。模型能力:模型能力:语音识别、问答对话、搜索/信息抽取等建议:建议:将大模型能力接入服务机器人,通过语音识别和对话管理系统,与用户进行自然语言交流,提供信息咨询、导览、导航和辅助服务。具备知识检索能力,快速响应用户查询,能自主导航至图书馆内任何位置,提升服务的互动性和可达性。此外,对于业务机器人,例如盘点机器人,可尝试 AI 能力嵌入,如优化 OCR识别结果,补全漏字,准确分类图书信息等。技术方案技术方案:提示词工程、RAG、智

    114、能体应用路径应用路径:直接集成应用的 Al 产品工具、需整合开发的 AI 产品与服务领域领域 20:无障碍智慧服务目标:无障碍智慧服务目标:通过大模型技术为视障读者提供无障碍的图书馆服务。模型能力:模型能力:语音识别、自然语言处理、文本到语音转换、图像识别与描述等建议:建议:开发专为视障人士设计的智能服务系统(或机器人服务),利用语音识别和自然语言处理技术,使视障用户能够通过语音与图书馆系统交互,检索和获取信息。系统应能自动将文本资料转换为语音输出,同时提供图像识别与描述功能,帮助视障用户理解视觉内容。此外,系统还应支持智能导航,辅助视障读者在图书馆内自由移动,提升他们的自主性和阅读体验。通过

    115、这些措施,图书馆能够为所有用户,包括视障人士,提供更加便捷和贴心的服务。技术方案技术方案:提示词工程、RAG、智能体应用路径应用路径:直接集成应用的 Al 产品工具、需整合开发的 AI 产品与服务领域领域 21:元宇宙空间智慧服务目标:元宇宙空间智慧服务目标:利用生成式 AI 技术,在元宇宙空间中为读者提供沉浸式和互动性的虚拟图书馆体验。模型能力:模型能力:自然语言交互、个性化推荐、情境感知、图像与语音生成等43建议:建议:将生成式 AI 融入虚实融合的元宇宙空间服务中。在图书馆的虚拟镜像或虚拟原生空间中,用户可利用自然语言交互,进行流畅对话,系统(或虚拟空间中的虚拟馆员)能理解用户的查询和需

    116、求。系统能够根据用户的阅读历史和偏好推荐相关书籍和资源。情境感知技术使得系统能够根据用户的行为和反应实时调整服务。此外,系统应具备图像与语音生成功能,为视障用户提供图像描述和文本到语音服务,确保所有用户都能享受到丰富的元宇宙阅读体验。通过这些技术,图书馆提供智慧、沉浸的元宇宙服务,吸引更多读者进入并探索虚拟图书馆空间。技术方案技术方案:提示词工程、RAG、智能体应用路径应用路径:需整合开发的 AI 产品与服务、自主/联合开发的 AI 原生应用领域领域 22:其他(楼宇控制、安防等)目标:其他(楼宇控制、安防等)目标:其他智慧空间领域,如通过大模型技术优化图书馆的楼宇控制和安防系统。模型能力:模

    117、型能力:图像分析、行为分析、预测分析、情感识别、智能决策支持等建议:建议:可展望通过集成大模型,系统能够学习用户行为,自动调节照明和空调等环境设置,优化能源使用并提升读者舒适度。同时,结合视频监控的行为分析功能,大模型技术可以识别异常活动,提前预警潜在安全风险,加强图书馆的安全管理。此外,大模型还能够处理大量操作数据,为管理层提供决策支持,实现基于数据的资源优化和策略制定,确保图书馆长期稳定运行。技术方案技术方案:提示词工程、RAG、智能体应用路径应用路径:集成定制开发的后端 Al 流程44第五章 图书馆典型大模型应用需求及场景举例第五章 图书馆典型大模型应用需求及场景举例图书馆通过融入 AI

    118、 应用,有助于在既有的应用场景中发现并挖掘新的价值,并持续驱动服务模式迭代更新。根据腾讯研究院 2024 年 5 月份发布的行业大模型调研报告,当前,大模型技术在各行业中的应用仍处于探索孵化期和实验加速期,虽然部分行业已经开始步入采纳成长期,但尚未有行业达到完全落地成熟期110。观察图书馆行业,大模型应用应处于实验加速期,市场已经开始出现相关产品,探索性成果和研究成果陆续发布。当前,图书馆行业大模型应用落地显示出一定的特征:1,在图书馆服务端,大模型技术的应用实施显示出较为迅速的进展。在图书馆服务端,大模型技术的应用实施显示出较为迅速的进展。当前主要集中在提升用户体验(如智能数字馆员)和增强学

    119、术服务上(如 AI 学术助手)。尝试通过增强用户互动和个性化服务,来提升服务质量。2,与服务端相比,后端业务生产流程的大模型技术应用落地进程较慢。与服务端相比,后端业务生产流程的大模型技术应用落地进程较慢。行业当前正积极探索和尝试如何通过大模型技术提高后端操作的自动化和智能化水平,以提高生产流程如采编、资源加工等环节的效率。3,图书馆正积极推进基于大模型技术的智能化工具助手,部分产品已达试用阶段。,图书馆正积极推进基于大模型技术的智能化工具助手,部分产品已达试用阶段。通过开发如图书馆平台副驾驶、馆员 AI 助手等应用,图书馆旨在提升馆员的后台工作效率,实现管理流程的优化。从前几章的分析中,我们

    120、挑选出大模型影响较深的图书馆八大领域,分别是:参考咨询、资源发现、阅读推广、学术服务、采编辅助、资源加工、数字人文、管理决策。通过深入分析这些领域的需求要素、潜在应用场景、当前案例情况,本章旨在展示相关领域下大模型应用的价值,为行业产品创新提出建议,为图书馆界大模型应用提供参考。110腾讯研究院.向 AI 而行 共筑新质生产力行业大模型调研报告,http:/ 5.0 图书馆大模型典型应用场景5.1 智慧咨询服务智慧咨询服务5.1.1 需求分析现状:需求分析现状:传统的自动化参考咨询服务由于依赖大量人工筛选和整理语料,常常难以准确理解用户需求,导致读者体验不佳。此外,系统难以识别的问题需依赖馆员

    121、手动回答,这随着线上服务需求的增加而增加了馆员的工作负担。不同馆员的业务熟练度也会影响问答的准确性,且回答风格缺乏统一标准。需求建议:需求建议:以最新 AI 大模型技术升级面向读者的智慧参考咨询服务,读者可以自助进行图书馆政策、业务、资源、使用等信息查询。建议智慧咨询场景包含以下的功能:(1)图书馆政策服务问答指导;(2)图书馆资源查询与推荐;(3)图书馆讲座、展览等活动信息及参与方式;(4)资源使用指导,读者问题解决、故障排解;(5)可结合数字人、机器人技术,进行交互体验服务。5.1.2 场景举例场景场景举例场景 1:问答式参考咨询服务:问答式参考咨询服务图书馆智慧参考咨询系统能以妥善的风格

    122、,准确自动地解答读者在使用图书馆服务时碰到的问题。例如读者咨询“如何参观预约上图东馆?”,系统自动给出预约流程说明,并给出相关预约操作链接。系统回复完成后,会提供联想问题以启发式追问,如“如何预约东馆座位”“查询东馆最新活动”等。对于图书馆馆藏咨询,结合查询模块和推荐模块,对图书馆资源进行检索、推荐、聊天互动。对于故障处理,当读者提问后,用自然语言引导读者进一步告知具体的故障现象,46根据故障描述、故障截屏并和运维后台数据相结合进行初步技术分析,自动处理一部分简单的故障,若不能处理则流转至人工。场景场景 2:智慧数字馆员服务:智慧数字馆员服务智慧数字馆员,借助人工智能与自然语言处理的前沿技术,

    123、以数字人形象为交互界面,实现了包含语音和视觉反馈在内的多模态交流。这种交互方式极大地提升了用户体验的直观性和个性化程度。智慧数字馆员的服务不局限于单一平台,能够跨越触屏设备、个人电脑以及移动设备等多种终端,确保用户可以随时随地享受到连贯且一致的服务体验。智慧数字馆员可以解答用户的即时咨询,包括但不限于图书馆开放时间、借阅规则、馆藏资源位置等。利用自然语言处理技术,数字馆员能够理解并回应复杂的用户查询,同时学习不断优化其响应策略。基于移动终端的数字馆员可增加物理、视觉等感知功能,不仅能够指导用户进行自助借还图书、找书,还能提供个性化的阅读推荐、辅助图书馆空间设备使用、导航至图书馆内的特定区域等功

    124、能。数字馆员还具备远程协助功能,当用户遇到技术问题或需要寻找特定资源时,可以联系数字馆员获得实时的指导和帮助。这种服务模式不仅提高了图书馆的服务质量,也极大地提升了用户的满意度和图书馆的整体运营效率。随着技术的不断进步,智慧数字馆员能力不断提升,并有望成为图书馆服务中不可或缺的一部分。场景场景 3:智慧机器人馆员服务:智慧机器人馆员服务智慧机器人馆员作为图书馆智慧空间服务的前沿实践,通过集成先进的传感器和人工智能算法,提供多维度的互动服务。这些机器人不仅能够协助进行图书的自助借还,还能提供智慧导览、视障帮助、解决故障等。例如:实体机器人通过语音描述,帮助视障用户理解图书封面、导航标识、艺术作品

    125、,辅助视障读者在图书馆内自由移动,安全地引导他们到达所需书籍的精确位置。在故障处理方面,智慧机器人馆员能够通过扫描读者证和图书信息,快速识别并解决借阅过程中的问题。它们还能够提供即时的技术支持,解决读者在使用图书馆设施时遇到的技术难题,如自助打印机操作、电子资源访问等。5.1.3 已有案例已有案例1.国家图书馆推出 AI 问答系统111,112111https:/ AI 智慧馆员晓书113台湾公共资讯图书馆与东海大学合作开发了一款名为“晓书”的生成式 AI 智慧馆员,应用了 ChatGPT、Digital Twin(数字分身)、真人声音合成等技术,能够全面解答读者关于图书、阅读以及图书馆内部设

    126、施的各类咨询。3.云瀚应用-海恒“小海豚数字馆员”114提供图书推荐、图书讲解、图书百科、馆藏查询、活动介绍、业务问答、业务办理等多种服务。能提供个性化主动式服务,将流程引擎和大模型进行结合,能推进流程,并进行流程节点的判断。4.云瀚应用-ChatBK 博看智慧咨询115该平台能够精准回答用户问题,实现定制化的用户服务。知识管理平台供图书馆自行对私有知识进行上传、编辑及预训练学习。5.2 智慧资源发现智慧资源发现5.2.1 需求分析现状:需求分析现状:传统的书目检索与文献搜索系统多依赖关键词输入,缺乏对自然语言查询的支持。同时,检索系统对没有具体借阅目的的读者,未能提供有效的服务引导和个性化推

    127、荐,使得用户难以发掘和利用图书馆的丰富资源。用户在面对图书馆众多的资源和数据库时,往往缺乏必要的了解和选择指导。需求建议:需求建议:提供检索的智慧增强功能,通过自然语言交互、多轮聊天启发等方式,帮助读者快速、智能地寻找到想要的馆藏纸质资源、数字资源。建立图书馆数字资源导航助手,帮助用户推荐最适合的数据库。5.2.2 场景举例场景场景举例场景 4:启发式资源检索服务:启发式资源检索服务112https:/ AI 相似文章推荐,并且提示有待进一步探索的问题。场景场景 5:跨资源智能馆藏检索与推荐:跨资源智能馆藏检索与推荐跨资源智能馆藏资源检索与推荐系统,可实现通过语义交互的方式,由智能化的资源代理

    128、检索工具,在理解读者检索需求后,自动在众多不同类型的馆藏资源中,为读者推荐适合的文献资源。读者可能的提问方式包括:“请帮我推荐可以了解最新 AI 进展的数据库”“图书馆有没有时间简史这本书?”“Nature 期刊的最新发文有哪些?”读者不同的问题需要查找的图书馆文献资源可能是不同的,提问的方式也各不相同。跨资源智能检索与推荐系统可以根据读者的需求,在不同类型的文献资源池中寻找相应的资源反馈读者。该功能的实现依赖于大语言模型 LLM 对读者需求的准确理解,并将需求转化成对后台不同类型检索 API 的调用请求。同时系统可对搜索结果内容进行二次排序优化和内容增强。可展示文献或图书等资源的封面、作者、

    129、内容等信息,以及该文献资源在图书馆中的索书号、馆藏地、借阅状态等,并提供相关的资源链接或借阅操作链接。本场景下的应能49够与智能问答系统、检索系统等多个系统协同工作,实现资源检索结果的优化展示。如由机器人服务,可以继续进行导航指引。此外,在进行馆藏资源推荐时,可以在获得读者信息的基础上,根据读者的历史行为画像,进一步分析做出精准推荐。大模型能列出推荐的书单和理由,可以跨资源推荐馆内所有相关资源,包括相关内容的阅读推广视频与活动视频等。针对推荐等资源,可提供 AI 总结。读者如不满意,可以追加描述,直到定位到满意的书单。5.2.3 已有案例已有案例1.日本横滨市立图书馆推出 AI 借书检索服务1

    130、16日本横滨市立图书馆推出 AI 图书检索服务,用户通过关键词或描述性句子即可获得书籍推荐,既帮助用户探索了丰富的馆藏,又提供建议激发读者阅读兴趣。2.清华大学图书馆上线 AI 导航助手117AI 导航助手能根据提问,提供精准的数据库资源介绍,并在每次问答之后,推荐 3 个相关数据库链接供直接访问。3.卢森堡国家图书馆针对数字化的期刊和报纸进行馆藏语义搜索118卢森堡国家图书馆依托其丰富的数字化期刊和报纸资源,利用大模型技术开展语义搜索,从而实现对馆藏内容的深入理解和高效检索。5.3 智慧阅读推广智慧阅读推广5.3.1 需求分析现状:需求分析现状:公共图书馆的阅读推广当前已成为行业发展的核心,

    131、并推动了从“书本位”向“人本位”的转型。阅读推广部门承担着图书及资源的策略性推荐、营销传播,以及文化活动的策划与执行等关键职能,如策划组织各类主题性、系统性的阅读活动,包括图书首发、学术讲座、阅读节等。同时,还需要通过新媒体渠道进行内容管理与创新传播,如微信公众号、短视频应用等,涉及内容编辑、视觉设计、多媒体制作与互动传播等一系列复杂任务。然而,阅读推广工作中,“浅阅读”116https:/libraryview.me/2024/01/22/16742/#more-16742117https:/ AI 等新技术手段,为读者提供智能化、个性化、沉浸式的阅读推广服务。(1)构建基于 AI 技术的智

    132、能阅读陪伴或推荐系统,通过分析读者的阅读行为、兴趣爱好等,为其提供精准的个性化阅读路径、阅读资源推荐,提高推广的针对性和吸引力。(2)建立阅推知识库、语料库,为 AI推荐提供底层数据支撑,融入常规的智能检索、推荐和问答服务。不断扩充推荐库,整合出版社的新书信息,图书馆员的推荐书单,以及专题推荐。整合具有公信力的书单和书籍信息,包括获奖作品、畅销书籍、分级读物等,以及作家的获奖情况。(3)结合元宇宙、虚拟现实等技术,通过 AI 虚拟馆员的引导,打造沉浸式的虚拟阅读场景,激发阅读兴趣。(4)通过 AIGC 技术,辅助馆员高效生产优质的阅读推广内容,如文案、视频、数字人物等,提高内容的创新性和吸引力

    133、,减轻馆员工作负担。5.3.2 场景举例场景场景举例场景 6:智能阅读伙伴服务:智能阅读伙伴服务这项创新服务旨在为读者提供基于图书馆资源的个性化阅读推荐和智能化阅读辅助。图书馆可基于自身丰富的资源,结合生成式 AI 技术,打造图书馆品牌的智能阅读伙伴应用或虚拟助理。该助理将通过自然语言交互,深入了解读者的阅读兴趣、阅读水平、时间安排等个人需求,并根据这些需求量身定制个性化的阅读路径规划。它不仅能推荐合适的书籍资源,还可以智能分析读者的阅读进度,提供持续的阅读建议和激励,确保读者保持阅读热情和节奏。同时,智能阅读伙伴还将与图书馆的其他服务无缝对接,自动完成借阅流程,提醒读者续借或归还图书,并推荐

    134、附近图书馆的相关资源。此外,它还能根据读者的兴趣爱好,推荐图书馆举办的各类阅读活动,为读者创造更丰富的阅读体验。通过这一智能化、个性化、全方位的阅读辅助服务,图书馆将成为读者的亲密阅读伙伴,激发51他们对阅读的热爱,提高阅读效率,最终实现阅读推广的目标。此外,该服务还可通过 AI 算法,根据读者的阅读兴趣、偏好、水平等因素,自动将具有相似阅读爱好的读者组织到同一个虚拟阅读社区中。场景场景 7:元宇宙虚拟馆员服务:元宇宙虚拟馆员服务在图书馆的元宇宙虚拟空间中,AI 驱动的智能虚拟馆员将全程陪伴和引导读者,为他们提供沉浸式的智慧服务体验。虚拟馆员可以以生动有趣的形象和自然语音交互,带领读者探索图书

    135、馆的镜像孪生空间或虚拟原生空间。它能够根据读者的兴趣爱好,定制个性化的虚拟导览路径,带领读者参观馆藏精品、特色文化展区、数字化古籍文物等,并提供丰富生动的讲解。在虚拟书库中,智能馆员可以根据读者的阅读偏好,推荐感兴趣的藏书。它能够深入解析经典作品的情节与人物,引发读者的思考与共鸣。此外,虚拟馆员还可以担任活动策划员的角色,组织各类主题鲜明、互动性强的元宇宙文学活动。例如,在上海图书馆的“元宇宙文学互动体验空间”中,可设计让虚拟馆员负责串联整个活动的故事脉络,引导读者沉浸其中,并通过与数字人物进行角色对话、书籍对话等,增强活动的趣味性和参与感。通过 AI 虚拟馆员的引导,读者能够在元宇宙中获得全

    136、新的沉浸式阅读体验,感受到图书馆服务的智慧化与未来化。虚拟馆员不仅能够减轻实体馆员的工作负担,还能够吸引更多年轻读者,为图书馆的阅读推广注入新的活力。场景场景 8:馆员阅读推广:馆员阅读推广 AI 工作站工作站提供馆员阅读推广 AI 工作站,馆员可利用 AIGC 工具进行阅读推广活动与内容的创作与开发。一方面,可以直接基于 AIGC 工具提供培训与活动。另一方面,可以辅助馆员开发和创作推广视频和文章。通过运用 AIGC 技术,可以辅助馆员撰写精炼且吸引人的文案,根据读者群体的特点和偏好,生成个性化的推广内容。馆员可以有效地进行视频内容的剪辑、特效增强以及文字自动转录等操作。结合 AI 数字人物

    137、与虚拟环境,馆员还能够制作出引人入胜的音视频材料。这些技术的应用将极大地减轻馆员在视频拍摄和制作方面的工作负担。此外,AIGC还可以辅助馆员进行内容加工与管理。AI 可以自动标记和归档视频、文档,标注出活动名、嘉宾、相关书籍等元数据内容和标签。馆员可以将形成的视频资源库、文案素材、活动资料等,发展为专题库,为未来的阅读推广提供素材支撑。5.3.3 已有案例已有案例521.新加坡国家图书馆管理局推出书籍聊天机器人 ChatBook119ChatBook 旨在帮助公众以更加便捷、高效的方式获取书籍信息。用户不仅能够与机器人进行互动,甚至可以与之展开“辩论”。在交流过程中,用户将收到购买或借阅书籍的

    138、推荐,以鼓励深入探索 NLB 在线资源。2.新加坡国家图书馆推出 StoryGen 人工智能图像生成服务120StoryGen 利用生成式人工智能技术,将文本故事转化为视觉及多媒体互动体验。用户可依据书籍中的角色、类型、故事等关键词,创意性地生成相应图像,打造出属于自己的故事世界,为用户带来一场沉浸式的阅读体验。3.上海图书馆进行虚拟人阅读推广,以及 AIGC 推广视频制作上海图书馆阅读推广部在“阅读日历”项目中,使用 GPT-SoVITS 和 Heygen等软件,通过声音克隆、虚拟数字人技术,将文字脚本转化为语音或数字人口播视频。通过 runway、suno 等工具尝试视频、音乐创作用于阅读

    139、推广。4.嘉兴图书馆、上海图书馆利用生成式 AI 为少儿读者提供活动服务121、122嘉兴市图书馆利用 Stable Diffusion 模型开发了适合未成年读者的 AIGC 绘图系统AI 绘梦大师,并同步开展关 AIGC 培训课程与活动。上海图书馆员工利用 Stable Diffusion 模型打造文生图模型应用,少儿读者可以在馆员的指导下,体验用生成式 AI 创作作图,并将所设计的图片进行个性化印刷,完成自创绘本制作。5.帕洛阿尔托市图书馆 ChatGPT 高级数据分析实验123通过优化 BiblioCommons 的分类体系以更精准地匹配读者的兴趣,旨在增强个性化推荐功能的相关性,进而提

    140、升用户在网页端的阅读体验。5.4 智慧知识服务智慧知识服务5.4.1 需求分析需求分析119https:/www.nlb.gov.sg/main/about-us/press-room-and-publications/media-releases/2023/2024-Year-in-Preview120https:/www.nlb.gov.sg/main/about-us/press-room-and-publications/media-releases/2023/2024-Year-in-Preview121https:/ environment 简称 PKE),成为学者的研究助手。该

    141、PKE 环境能建立在图书馆跨数据商资源的基础上进行智能学术研究,或能集成图书馆或多个数据商的智能学术研究工具,提供智能研究环境。(2)增强智慧教学与学科服务,通过 AI 学习助手为师生提供个性化和智能化的学习支持,包括个性化学习路径规划、互动学习体验及学术研究辅助。AI 助手的应用深化了教学和学习的互动性,并通过数据驱动的分析优化了教学方法。(3)推广 AI 素养教育,通过互动平台和虚拟环境提高学生、馆员、公众的信息素养和技术使用能力。5.4.2 场景举例场景场景举例场景 9:个人知识研究环境(:个人知识研究环境(PKE)服务场景)服务场景图书馆可建立一个最大限度整合的学术资源的个人知识研究环

    142、境(PKE),为用户提供一个一站式的智能学术服务平台,利用大模型为用户提供个性化的辅助功能,集成图书馆(或多个合作数据商)的智能学术检索、文献智能与解读工具,辅助个人研究选题、辅助文献快速阅读、进行个性化文献推荐,辅助生成研究大纲,以及内容生成、审稿检查等功能,覆盖个人知识研究的全流程。(1)多文献分析:提供 PDF 文档分析,包括内容总结、解读论文、抽取研究问题、解释学术概念,支持交互式问答,生成概念知识图谱。(2)选题与学习路径建议:根据研究领域或问题,生成选题建议,提供文献支持和参考,创建个性化学习路径。(3)个性化文献推荐:根据自然语言检索需求,推荐期刊、书籍,自动检索推荐相关资源到个

    143、人空间,展现摘要、概述等,自动发送更新内容到邮箱提醒。54(4)大纲生成与写作:智能生成研究大纲,包括标题、摘要等,提供内容提示和写作指导,根据用户反馈优化内容。(5)论文优化与审稿:根据期刊或会议要求,进行审稿检查,包括格式、语言、逻辑等,提供修改建议和报告。场景场景 10:智慧学科服务场景:智慧学科服务场景在智慧学科服务场景中,图书馆可以充分利用生成式 AI 技术,为师生提供个性化、智能化的学习与研究支持服务。首先,AI 助手可以扮演智能学习伙伴的角色,增强个性化学习路径规划、互动式学习体验、学习效果评估等环节。基于大模型的自然语言交互能力,AI 助手能够深入了解学生的知识结构、学习偏好等

    144、,为其量身定制个性化的学习路径和资源推荐。在学习过程中,AI 助手还可以通过情景模拟、虚拟实验等形式,为学生创造身临其境的互动式学习体验,激发学习兴趣。其次,AI 助手可以担任智能研究助理,快速响应师生的学术咨询需求,提升研究效率。基于对多学科知识的融合理解能力,AI 助手能够为复杂问题提供求解思路,支持跨学科知识的整合运用。在文献检索、数据分析、论文写作等环节,AI 助手也可以为研究人员提供高效的辅助服务。此外,图书馆还可以利用大模型技术,构建智能教学质量分析系统。该系统可以基于学生的学习行为数据、课程资源数据等,对教学效果进行数据驱动的分析评估,为教学方法的优化改进提供决策支持。通过大模型

    145、/生成式 AI 在智慧学科服务中的应用,图书馆将成为师生学习与研究的智能助手,提供个性化、高效率、高质量的服务支持,促进教育教学质量的全面提升,推动学科建设和科研创新的发展。场景场景 11:AI 素养教育场景素养教育场景图书馆作为知识和信息的中心,在 AI 素养教育方面扮演着重要角色。AI 素养教育包含 AI 知识、AI 技能、AI 价值观、伦理等方面的教育124。图书馆通过升级信息素养课程、组织专题讲座、嵌入式教学、参与 AI 研发项目、推动跨学科合作,提供能力构建与应用实践平台等方式手段,培养用户对 AI 的理解、批判性思维和伦理意识,以积极适应 AI 技术的发展。高校图书馆通过提供整合提

    146、供多样的 AI 应用培训和资源,致力于提升学生的 AI 素养和跨学科应用能力。通过系列讲座和工作坊,学生不仅学习如何有效使用 AI 工具,还培养了批判性评124蔡迎春,张静蓓,虞晨琳,王健.数智时代的人工智能素养:内涵、框架与实施路径J.中国图书馆学报:1-17.55估 AI 技术的能力,包括其潜在的偏见和伦理问题。图书馆应建立 AI 实验室或在线平台,让学生或用户有机会接触和使用最新的 AI 工具和资源。图书馆应提供必要的学术资源和平台,支持学生在 AI 领域的创新和项目开发,推动对 AI 技术的深入理解和应用。5.4.3 已有案例已有案例1.多家图书馆上线试用 Scopus 科研助手125

    147、,126,127ScopusAI 是基于全球最大的同行评议摘要数据库 Scopus 训练的生成式 AI,专门用于科研检索发现,提升科研人员的检索效率。清华大学图书馆、中国人民大学图书馆、上海外国语大学图书馆等多家单位已上线试用服务。2.多家图书馆上线星火科研助手服务128,129,130科技文献大模型-星火科研助手是由中国科学院文献情报中心与科大讯飞股份有限公司联合研发的智能知识服务平台。星火科研助手已在哈尔滨工业大学图书馆、中国科学院用户(中国科学院上海应用物理研究所、中国科学院大学南京学院、中国科学院职务研究所)等多家单位上线服务。3.知网推出 AI 学术研究助手服务131知网 AI 学术

    148、研究助手是 CNKI 推进的问答式增强检索和生成式知识服务的场景实践。基于 AI 技术驱动的智能化服务,大幅简化繁复的检索与研究流程,用户仅需以自然语言提问,即可直接快速获得答案,并可连续追问。4.Clarivate 推出 Web of Science AI 研究助手和 ProQuest 研究助手132Clarivate 正将对话式发现探索功能融入 Web of Science 研究助手和 ProQuest研究助手中。Web of Science 研究助手通过对话形式,为研究人员提供便捷的问题解答途径,进而提升研究效率,并加深他们对 Web of Science 数据中新兴主题领域的认知。Pr

    149、oQuest 研究助手起初专注于 ProQuest One Literature 的 AI 对话式发现工具,并计划通过严格的测试和验证,覆盖各大重要学科领域。125https:/ AI 助教133清华大学借助与智谱华章公司共同研发的 GLM 大模型,成功构建了 AI 助教系统。该系统为学生提供全天候的个性化学习支持,包括智能评估和即时反馈,有效促进了学生的深入思考。AI 助教使学生能够快速理解复杂概念,并提供基础知识的丰富支持,极大地助力了学生的新领域探索和自主学习过程。6.Alethea:AI 驱动的学习平台和学术教练134Alethea 是一款致力于推动学生对课程资料和学术文献积极参与的学

    150、习工具,其核心目标在于促进学生的深入阅读和学习。通过 AI 支持,Alethea 帮助学生更好地理解所学知识。7.密歇根大学推出定制生成式 AI 服务135密歇根大学为提高学生的 AI 应用能力,提供三种生成式 AI 服务产品,旨在公平、可及且支持各种用途。U-M GPT 提供流行的托管 AI 模型的访问;U-MMaizey 则允许用户根据自有数据集定制化体验,以发掘深层见解;第三种 U-MGPT Toolkit 是最高级别、最灵活的产品,专为需要完全掌控 AI 环境和模型者而设计,API 网关可根据要求提供。这些产品组合涵盖从基础使用到高级研究的全方位需求。5.5 智能采编辅助智能采编辅助5

    151、.5.1 需求分析现状:需求分析现状:目前的采访环节依赖于馆员的专业知识与经验积累,且多数任务存在重复性质。采访书目的选拔过程需遵循一系列固定与动态规则,其决策往往基于馆员对于多源数据的综合查询与判断。尽管固定规则可以依托系统字段进行初步筛选,但面对持续更新及变化的采访标准,现行的采访系统功能显示出局限性。进一步,现有的采访统计工具未能充分适应馆员对灵活、综合性统计分析的需求。采访相关的数据整合往往跨越多个系统平台,增加了馆员在信息汇总和分析过程中的工作负担。133https:/ 场景举例场景场景举例场景 12:基于动态需求的交互式采购建议:基于动态需求的交互式采购建议根据馆员 prompt

    152、要求,自动生成符合金额、类型、出版社、声誉等的要求的采购书单建议。例如“预算 20 万元采购少儿文学图书”,模型即刻筛选出满足条件的书目,输出包括书名、作者、出版社、价格与折扣、奖项信息及出版社信誉等详尽信息的推荐书单。可要求“给出最近 1 年在文学主题方面,获奖、评价、影响力高的图书,并结合馆藏提出采访建议”。对于可能引发舆情风险的出版物,模型可以在书单中对应的出版社、作者或内容主题进行高亮提示,以便馆员做出进一步评估。基于当前采购流程的 AI 模块嵌入。(1)多维度批量筛选。基于供应商的征订目录及平台全量出版社数据,结合大模型能力,快速筛选所需图书品种。此模式下,馆藏规则的配置与管理可以更

    153、加多样化及柔性。如快速剔除不适藏品种,根据预算、预采购品种数、出版时间快速框定采访范围。(2)重点品种推荐。基于全量出版数据及其他图书馆的采访数据,通过大模型自动形成重点推荐清单。如根据历年借阅历史偏好、其他图书馆采访数据、本馆关注重点作者、出版社等信息,形成综合性的重点推荐,适合查漏补缺、重点关注学科等业务场景。(3)专题书单推荐。在常规采访业务外,经常会有基于专题的突发采访任务,在此种采访场景下,一般会限制采访目录的采访数量、主题(分类号、关键词、出版社、58读者对象等)等条件,为了快速适应不同的采访业务需求,可以借助大模型提前对采访基础数据做尽量多维度的数据训练来应对各种采访需求。(4)

    154、电子书基于全文内容的推荐采购。基于有全文内容的馆配电子书,可以将全文内容作为知识库构建基础,为专业采访馆员提供基于内容的电子书采购推荐服务。这些基于大模型的智能提示模板可被馆员快速调用和个性化调整,同时馆员也可以结合外部数据源,通过模型的分析来进行综合的资源配置决策,以确保书单的合理性和全面性,从而更好地融入图书馆的总体藏书规划。例如:除了以提示模板提供采购建议外,也可以构建动态自动化采购分析与决策支持模块,这一模块能够分析历史采购数据、阅读者借阅习惯、书籍流通率及社会热点趋势等信息,结合图书馆的采购预算和藏书发展策略,自动生成科学合理的采购建议书单。该系统不仅可以对新书进行推荐,还能对库存进

    155、行动态管理,提示哪些存量图书应当增购或淘汰,从而确保藏书的时效性和多样性。场景场景 13:AI 辅助自动编目流程辅助自动编目流程基于大模型的自动化编目流程可以包含几个阶段:基础数据自动解析:系统接收到新书的基础数据后,自动解析并填充必要的元数据字段,如题名、作者、ISBN 等。联合编目信息对接:自动与联合编目系统(如 OCLC 或国家图书馆联合编目系统)进行数据交换,尝试匹配并同步已存在的书目信息。大模型补全缺失数据:对于联合编目系统中未能匹配的书目,系统将调用大模型,利用现有的出版商信息以及其他公开来源的信息,补全书目信息,并生成初步的编目记录。智能分类号推荐:大模型根据书目的内容和主题提供

    156、一个或多个分类号推荐,供编目人员选择和参考。人工审核与提交:编目人员进行最终的审核和验证,确保信息的准确性和完整性后,完成编目流程的提交。场景场景 14:智慧采访数据处理与分析:智慧采访数据处理与分析在图书馆采编流程中,集成大模型可以极大地优化并提升数据处理和分析的效率与质量。以下为采编场景下利用大模型进行数据处理和分析的 2 个案例,可以大大提高馆员效率。59例 1:电子资源自动数据处理目前上海图书馆采编部门通过“数据库使用成本”指标,指导来年数据库的采购。在计算过程中,需要从百余个不同格式统计文件(doc、xls、counter.)寻找相应字段,手动汇表,并根据合同规定服务时间,进行合同期

    157、限内电子资源数据库使用量制表与计算。这一过程重复度高、耗时大、人工成本高。大模型能帮助快速地解决这一困境。首先,通过对不同格式的数据商报告文件自动进行数值提取与格式转换,形成统一规范的数据表格,生成表格如下示例。(示例表)资源商电子资源名称X 年 1 月X 年 2 月X 年 12 月总计数据来源下载量浏览量第二步,通过大模型提取合同要素,生成统一格式表格。字段包括例如:资源商、合同时间、合同服务核心内容、合同文本链接等。第三步,让大模型自动生成需要的“数据库使用成本”统计表,数据库使用成本为合同期限内电子资源数据库使用量。例 2:采编订单智能匹配及资金监控采编部门不定期采购征订纸质图书资源,采

    158、购合同、包件、代理商、订单之间存在比较复杂的多对多逻辑关系。对于采访系统生成的新的订购单,需要为其匹配到合适的某个合同包件中,并将该订单匹配到特定代理商,同时符合所在合同的资金总额、所在包件的资金总额需在控制范围内。由于采购合同、包件、代理商订单之间的关系复杂,馆员人工计算量大,耗时长,随机性大,对于全局合同的资金监控和合同履行过程资金情况把握困难。馆员日常在该步骤进行数据查询与统计计算的过程耗时,是采编当前流程中的瓶颈模块。在过程中嵌入 AI 技术,进行采访订单的智能规划与自动匹配,并能够对结算资金金额做到便捷性、灵活性的查询监控。(1)系统订单生成后,根据订单的金额和对代理商的要求,AI

    159、程序进行合同与包件的匹配,系统生成匹配方案列表,并自动显示各个匹配方案的资金余额情况。若合同或包件金额不足,订单金额超出,需要进行智能分析以及切分匹配,或者智能提示减掉哪几本图书。(2)60馆员还可以聊天对话的方式,对代理商或合同包件的各类金额额度、完成率、支付情况等进行资金询问与监控,能够及时发现采购订单过程中的问题,进行快速的统计制表、制图。大大提高工作效率和流程。5.5.3 已有案例已有案例1.美国爱荷华州某图书馆利用 ChatGPT 进行图书审查剔除136美国爱荷华州一学区图书馆已经开始使用人工智能辅助内容审查,包括追风筝的人使女的故事在内的 19 部作品遭遇下架。2.比利时皇家图书馆

    160、 AI 自动编目137比利时皇家图书馆(KBR)探索自动化编目流程,通过 OCR 技术和 AI 模型自动识别元数据并丰富书目记录。该流程包括三个关键 AI 模型:第一个模型从标题页提取基本信息,第二个模型从底页识别详细出版信息,第三个模型通过封底信息进行图书分类和主题标引。这一创新方案显著优化了编目过程,节省了手动输入时间,并提高了编目工作的准确性和效率。3.德国国家图书馆 AI 自动索引实验研究138“AI 自动索引”(AI for Automated Indexing)是德国图书馆 2021 年启动的项目,旨在加速自然语言处理、数据科学和机器学习方法在图书馆中的应用,为机器主题索引的应用提

    161、供新思路。德国图书馆在该项目中加入了大模型自动索引的实验。4.面向中图法自动分类的大语言模型提示学习实践与研究139作者将提出的基于多模态注意力提示学习网络(MAPL)和 ChatGPT 大语言模型的提示学习模型与传统的机器学习算法(SVM、NB)和深度学习方法(RNN、CNN、LSTM、Att-LSTM、Bert 等)进行比较,ChatGPT 模型在各项评价指标上均取得了优异的结果。在一级类目分类任务上达到了 90.7%的准确率,二级突破80%,三级类目突破 70%,显著性远超其他比较方案。136https:/ Lowagie.One automatic cataloging flow:te

    162、sts and first resultsEB/OL.2023-08-29.https:/repository.ifla.org/bitstream/123456789/2686/1/157-lowagie-en.pdf138https:/c18004- ChatGPT 执行三个常见的编目/元数据任务,分别为:1)分配杜威十进制分类号(DDC),2)选择国会图书馆主题标题(LCSH),3)建议关键词。5.6 数字资源智能加工数字资源智能加工5.6.1 需求分析现状:需求分析现状:当前图书馆数字资源开发的实践中,流程成熟但操作效率仍有待提高。这些工作流程一般包括项目规划、文献数字化扫描、光学字符

    163、识别(OCR)处理、数据标注与元数据输入、文献分类与索引编制、数字产品开发以及最终的用户服务推广。在这一连串的流程中,OCR 技术的应用尚未达到理想的效能水平。图书馆很多资源仅识别到篇名,仍旧需要针对大量文献进行全文识别。对于那些存在缺损或原始印刷质量不佳的历史文献材料,常常需要专业人员进行文字推测和补全工作。同时,图像内容的描述主要依靠人工完成,而文献的主题索引和分类工作也以人力为核心。需求建议:需求建议:现阶段,对数据处理流程进行优化,期待利用自动化或半自动化手段,在数据识别、加工、描述等环节中实现效率提升,并在此过程中减少人工参与经济成本。这一转变着眼于利用 AI 的高效数据处理能力,以

    164、应对传统手工操作的局限。5.6.2 场景举例场景场景举例场景 15:自动元数据描述与分类:自动元数据描述与分类应用大模型技术为各类数字文献生成详细的元数据。通过大模型自动理解文章内容,包括但不限于标题、摘要、关键词等,以生成初始的描述性元数据,并生成专业的数据格式。这些元数据不仅包括传统的编目信息,如作者、出版日期和出版社,还能够识别和提取文章的核心主题和研究领域,为后续的分类工作提供基础。利用大模型的深度学习能力,对资源进行智能分类标引,能够依据中图法自动生成合适的分类号和主题词。通过大模型增加资源描述的颗粒度及范围,例如进一步深度标注,例如按要求生成各类标签、抽取人地时事机构作品等实体,1

    165、40https:/journal.code4lib.org/articles/17867https:/shareok.org/bitstream/handle/11244/339626/oksd_bodenhamer_reliability_and_usability_of_2023.pdf?sequence=3&isAllowed=y62并标注实体关系(知识图谱)等。该场景可以实现对文献的结构化和语义化表示,辅助生成知识图谱,构建文献之间的关联关系,提高文献的检索和利用效率。现阶段,利用生成式 AI 进行资源描述,可以作为图书馆员的辅助工具,同时也需要专业人员的监督和验证,以确保生成的元数据

    166、和分类的准确性。场景场景 16:图像自动识别与标引:图像自动识别与标引能够自动识别提取图像,并进行自动图像标引。利用大模型自动标引图像的各种特征,生成图片的文字描述、内容描述,为馆员的编目工作提供更丰富的参考。该场景可以实现对图像的视觉分析,提取图像的颜色、形状、对象、场景等信息,并生成相应的标签和元数据。该场景还可以利用自然语言处理技术,生成图像的摘要或详细描述,帮助理解图像的主题和内容。利用已有历史图片进行学习与训练,实现利用模型自动识别不同历史时期、主题、地点、人物等信息。该场景可以实现对历史图片的深度学习,识别图片中的重要元素,如时间、地点、人物、事件等,并将图片按照这些元素进行分类和

    167、归档,实现基于图像内容的深度检索。也可以将训练好的模型对外提供智慧服务。该场景还可以利用知识图谱技术,构建图片之间的关联关系,展示图片的历史背景和文化意义。5.6.3 已有案例已有案例1.利用Claude Haiku模型将国会图书馆扫描档案转为结构化文本141利用Claude Haiku对国会图书馆的“联邦作家项目”扫描文档进行快速、准确地识别,不仅能够获得历史资料的转录,还能生成带有元数据的结构化JSON输出。包括题名、日期、关键词等。2.埃默里大学利用Chat GPT API从印刷参考书目中提取元数据142埃默里大学在创建非裔美国人报纸和期刊:国家目录在线版的过程中,利用ChatGPT A

    168、PI自动识别和提取关键元数据,包括标题、编辑姓名、出版日期和主题等,生成了结构化的输出结果,显著节省了人工处理所需的时间。3.汉王打造古汉语大模型,构建古籍文献和辅助著录与标引大模型方案143141https:/ 年),https:/ 数字人文智慧研究与服务数字人文智慧研究与服务5.7.1 需求分析现状:需求分析现状:越来越多的文化遗产机构、图书馆和档案馆将他们的藏品数字化,为人文领域的研究者提供了文本、图片、音频、视频等丰富的素材,众多研究者和机构也在不断开发或更新已存在的数字语料库,形成一些数据基础设施;越来越多的研究者使用量化或建构模型的方式分析和解决研究领域中的问题,通过对大规模文本和

    169、数据的挖掘分析的研究方法,为人文学科提供了新的研究视角。然而,数字人文研究依赖数字化的文本、图像等数据,通常对数据质量和可靠性有较高要求,需要使用技术工具和软件,或需要涉及多学科的合作。数字人文研究者通常要面对的挑战有:一是数据搜集的复杂性。需要从多种渠道搜集数据,不同数据来源可能有不同的数据格式、访问等问题;二是数据操控和分析门槛高。研究者需熟练使用数据操作、清洗、分析的技术工具和软件,这对技术知识和技能要求高。目前许多工具功能单一,无法满足研究者多样化和系统化的需求;三是缺乏整合的平台提供便捷的研究支持。尽管有众多的数据和工具可用,但它们常常分散在不同的系统和平台上,缺乏一体化和流程化的操

    170、作环境,使得研究过程繁琐、效率低下。需求建议:需求建议:建立数字人文助手平台,包括(1)建立基础设施平台:在图书馆已有资源的基础上,建立和维护一个资源与工具一体化的平台。整合图书馆的文本、图像、音视频资源和常用分析工具,实现数据收集、处理、分析和展示的全流程操作,提高图书馆珍贵资源利用率。(2)整合利用最新AI技术:结合利用生成式AI等技术,提高文本、图像等数据的分析效率。自动标注、文本分类、情感分析、命名实体识别等功能,辅助研究者更快速地理解和解释大规模数据;结合图书馆资源和AI,提供文献的智能解读和知识问答、历史人物跨时空对话、基于文献的AI创作等。5.7.2 场景举例场景举例64场景场景

    171、 17:AI 辅助古籍研究辅助古籍研究图书馆有大量、多种珍贵的古籍资源,可借助大模型能力提供直观易用的资源平台,平台集成图书馆丰富的古籍资源,支持多种检索方式,帮助研究者快速定位所需的古籍文献,获取所需的知识内容;并对海量古籍进行自动化索引,提取关键信息,如古籍的作者、年代等信息,生成专题目录;在平台上应用先进的文本处理和内容理解技术、提供智能化注释和古白翻译等服务,协助用户进行古籍文献研究:(1)古籍的文字识别和文本处理:对古籍图像进行自动 OCR;利用大模型的上下文预测对不完整或缺损部分进行文字补全、缺字还原,模糊或缺失的字迹,模型可以给多个预测结果,供研究者挑选和确认。对于竖版繁体等古文

    172、字内容,进行现代文字转换或其他格式转换,方便阅读和处理。(2)古文的内容理解和注释:古籍普遍没有标点,可借助大模型进行自动句读和标点添加,使得文本结构更清晰,增强可读性;使用 AI 技术对文本内容进行分析,提取文本中的关键词、实体(如人名、地名、事件)等信息,方便研究者快速理解文本内容、构建知识图谱;或结合已有的语料库,对古籍中难以理解的词汇、典故和语句进行自动注释和解释,提升理解的深度。(3)文白翻译与现代语境转换:利用大模型提供自动翻译服务,使古典文献更易于理解和传播;还可结合历史背景,对文献进行语境再造,帮助理解文献在当时社会和文化中的位置和意义。(4)版本对比与校勘:借助 AI 对同一

    173、古籍的不同版本进行文本相似度分析,帮助研究者找出异同之处,提供版本研究的线索和证据;在辅助校勘过程中,利用 AI 协助识别和纠正错误,提高研究效率。(5)研究与学术支持:利用大模型对各种格式类型的文献进行高效信息提取和转换,提高信息的质量和可用性,包括将图像、手稿、印刷文本等多种格式的数据统一为结构化文本,便于分析和处理;对平台古籍数据进行主题建模,揭示文本中的潜在主题,辅助研究者进行综合分析;利用 AI 技术,可以为研究者提供个性化推荐服务,根据其研究兴趣和历史搜索记录,推荐相关的古籍文献和资料。场景场景 18:AI 辅助历史信息考证辅助历史信息考证65利用知识库+大模型的方式,为用户提供已

    174、有资源中的特定信息,辅助历史地理、社会学、文学等多学科的知识考古,并提供创新性服务。(1)构建智能历史地理知识库:整合图书馆的历史文献、地理信息、专业文献、社会学资料等,创建多维度数据平台。利用大模型和AI技术自动整理、索引,提取关键信息,生成结构化知识图谱,以助研究者高效检索和使用。(2)面向历史信息的知识发现和智能检索:提供智能化一站式检索,支持研究者针对某个人物、主题或地点进行知识发现。系统将利用大模型的NLP技术,综合分析并智能问答,提供基于历史背景的全面解释分析。(3)动态历史地名转换与展示:结合古今地名语料库,能将历史地名在不同时期地图上进行智能转换与展示。通过可视化技术,研究者可

    175、通过时间轴和交互工具动态查看地名随时间的变迁,并结合历史事件和人物进行分析与考证。(4)跨学科研究支持:利用大模型的综合分析能力,支持历史地理、社会学、文学等多学科的交叉研究。例如,可以自动聚合不同学科的数据,分析某一历史事件在不同区域和文化背景下的影响。(5)历史场景还原和创新性服务:利用大模型的生成能力,结合文献描述、考古资料,可以部分重构历史场景,以 3D模型、虚拟现实(VR)或增强现实(AR)的形式呈现。研究者和公众可以通过虚拟体验,更直观地感受和理解历史情境。场景场景 19:AI 辅助大众创作辅助大众创作利用图书馆历史文献资源和知识库(包括古代和近现代图书/报刊/杂志/老照片/音视频

    176、等),提供融合的一站式检索的资源库,协助文学创作者挖掘特定历史背景中的人物、事件等信息,获取全面的、脉络性的历史知识。在此基础上,通过利用大模型的能力,提供个性化的问答模型,支持与创作者互动,为文献创作者提供多种智能化服务,以提升创作效率、丰富创作内容、并激发创作灵感,推动数字人文与文学创作的深度融合与创新。例如提供一些创作灵感或主题,为作家提供启发和想法;学习作者的作品风格和创作特点,根据作者筛选的文献语料等生成一些初始的创作片段或句子,供创作者参考,对创作文学作品进行辅助。也可协助研究和分析文学作品,如自动分析作品中不同人物的情感变化、语言风格、对于不同事件的影响和反应,分析不同版本作品的

    177、差异/改动、作家的用词66风格和偏好;识别、分析同一个创作者不同时期的作品变化、比较不同创作者的创作特点;对作品进行概括、扩写、创作同人文等。5.7.3 已有案例已有案例1.利用 AI 辨别匿名手稿144维也纳和巴利亚多利德大学的研究人员利用 AI 技术,在西班牙国家图书馆(BNE)发现了费利克斯洛佩德维加的一部未知戏剧作品法国女人劳拉。通过工具和模型,研究人员自动化转录了 1,300 份匿名手稿,并通过对词汇使用的比较分析,确定了该作品与洛佩德维加的其他作品存在密切的联系。2.AI 破译 2000 年前上古卷轴145Herculaneum Papyri 图书馆的纸莎草卷轴在公元 79 年的火

    178、山爆发中被埋藏,直至 18 世纪被挖出,却已碳化成难以展开的木块状。近期,借助 AI 技术,这些古卷轴近 5%的内容得到了成功破译。3.南京农业大学、中华书局开发荀子古籍大语言模型146荀子古籍大语言模型具备多项自然语言处理任务的能力,包括但不限于文本分类、分词、命名实体识别、古现翻译等。模型通过构建 ACHeval 评测基准,对大语言模型的古籍文本处理能力进行评估,为古籍研究者提供了有效的模型选择和开发参考。4.北京大学与字节跳动数字人文开放实验室开发“识典古籍”平台“古籍智能助手”147基于字节跳动自主研发的云雀大语言模型,识典古籍数字化平台上线了“古籍智能助手”。通过古籍智能助手,用户可

    179、以与正在阅读的古籍进行对话,利用AI 技术,智能阅读古籍,协同整理古籍。5.山东大学数字人文实验室开发文翰(WH)边疆古籍大模型148文翰(WH)边疆古籍大模型是一个专注于古汉语典籍的人工智能大语言模型,它通过结合中国经典古籍数据训练,提升了文言文处理能力,并进一步优化144https:/doi.org/10.5565/rev/anuariolopedevega.492145https:/ 馆员智慧助手馆员智慧助手5.8.1 需求分析现状:需求分析现状:当前图书馆馆员在日常业务处理中面临信息孤岛和操作复杂性的问题。尽管现有系统能够提供基础服务,但缺少智能化辅助和个性化推荐功能。在资源管理、读者

    180、服务和数据分析等方面,馆员多依赖手动操作,效率受限。跨系统的信息检索和业务整合也要求馆员在多个应用间频繁切换,影响了工作流程的连贯性。因此,需要一个集成化、智能化的馆员智慧助手系统,以提升服务效率和质量。需求建议:需求建议:(1)建议为图书馆馆员打造一个基于图书馆平台(LSP)的智能化的辅助工具,通过自动化和智能化场景调度后台管理流程,以提高操作效率、并增强决策支持能力。(2)为馆员提供一个提供丰富的、集成式的多功能助手工具平台。整合馆员知识库、图书馆平台助手、数智助手、学术助手等业务助手,集成如写作助手、多模态助手、业务培训助手等大模型的创新工具应用,以提高工作效率。5.8.2 场景举例场景

    181、场景举例场景 20:图书馆服务平台(:图书馆服务平台(LSP)副驾驶)副驾驶建议开发图书馆服务平台副驾驶(Copilot),为馆员提供辅助。该系统具备文字和语音输入功能,允许馆员通过平板电脑或桌面电脑快速提出业务需求,并获取相应的应用入口和信息导引。该系统能够利用大模型技术提供实时数据分析和决策支持。此外,系统应支持个性化服务,能够根据馆员的具体需求,提供定制化的信息检索、资源推荐、创作开发和业务流程自动化。同时,应确保系统的用户友好性和可扩展性,以适应未来技术发展和图书馆服务模式的变革。68馆员可以按需唤起图书馆服务平台智能AI助手服务,通过提出业务需求,助手返回相应应用并提供访问方式。例如

    182、,采访馆员提示“查看本月订购期刊订单”,AI助手直接打开相应订单页面。根据馆员要求,助手能定位到相应应用并实现功能和数据交互。例如,馆员询问“阅读广场座位现在还可以预约吗?”AI助手调用座位预约API查出当前预约座位情况,并提供预约链接或建议其他空闲座位。此外,AI助手能够从现有应用获取数据,进行数据分析,如针对馆员提交的数据文件进行分析,例如“上个月流通量最高的时间段、位置?”馆员助手迅速调用流通数据记录,并针对时间、地点两个维度的数据进行分析,通过图表或热力图直观展示高峰时段和高流通区域,辅助馆员制定资源分配策略和服务改进计划。场景场景 21:馆员:馆员 AI 助手(助手(Copilot)

    183、图书馆馆员AI助手(Copilot)是馆员业务工作的得力助手,通过整合馆员知识库和图书馆服务平台的智能副驾驶,为馆员提供AI增强的业务支持和智慧工作场景。首先能够实现对图书馆业务知识库的问答,使得馆员能够迅速上手业务。馆员知识库收集了必备知识、工作经验、值班文档、规章制度等。馆员助手实现了图书馆平台助手功能的整合,将馆员日常工作所依赖的多个信息系统后台统一接入,确保了核心服务接口的一致性。通过馆员助手客户端,馆员能够便捷地访问和使用这些服务接口,从而高效地执行业务流程和组合操作。具备日常系统后台维护功能,确保底层所有服务接口都能统一供客户端使用,完成业务组合操作。整合数智助手,整体展示馆员对各

    184、类资源、读者、图书、空间、应用等的使用情况,各项目知识库的使用情况,调用数据中台,基于大语言模型技术自动生成统计分析报告并进行可视化展示,支持对历史数据的分析和比较。馆员助手整合集成本地大模型工具服务,支持各领域中生成式AI工具调用与创意使用,集成如学术助手、写作助手、多模态助手、业务培训助手等大模型的创新工具应用,以提高工作效率。5.8.3 已有案例已有案例1.云瀚应用-阿法迪云瀚馆员助手149面向馆员的智能助手,将大模型技术嵌入图书馆业务,为云瀚平台功能(流通、采购、编目、电子资源管理、系统管理)提供智能助手。用户可通过自然语149https:/ AI 大模型能力的软件平台。支持本地部署,

    185、适配多种操作系统和硬件,可离线运行。提供一键安装,以及模型与功能的灵活分离。用户可以下载所需模型或 API 调用远端模型,支持完全离线使用或联网更新。平台支持多用户配置,并提供从基础对话、翻译、写作到高级图片识别、音频转录、视频生成等多功能服务。70第六章 总结与展望第六章 总结与展望随着人工智能技术的飞速发展,大模型技术已成为图书馆领域创新应用的新引擎。本报告通过对图书馆领域大模型应用的广泛调研,揭示了其在智慧图书馆建设中的潜力与可能性。报告选取了图书馆领域大模型应用的八个典型场景进行具体介绍,展现了大模型技术如何为图书馆的未来发展注入新的活力。大模型技术不仅赋能和升级了图书馆的传统服务与业

    186、务,而且推动了智慧服务的创新发展。通过大模型的应用,用户和馆员能够以更为直观、高效的方式与信息资源、信息系统进行互动。大模型的应用赋予业务流程环节以高效智能,通过图书馆服务平台(LSP)的 AI 升级,为业务流程提供了全新的高效智能服务支撑,进一步改进业务逻辑,并可能引发资源组织、加工流程的变革。这些变化不仅具有图书馆的行业特色,而且影响深远,它们可能从局部创新点扩展到整个服务面,全面革新图书馆的服务模式和业务模式,为图书馆带来数字化转型的全新机遇。在所有的大模型创新应用中,最值得关注的一类,是图书馆 AI 原生型的应用,尤其是未来“智未触及”的新应用。可能是全新未发掘的服务模式,也可能是智能

    187、代理、全模态、人机交互等先进技术的应用。图书馆在未来将不仅仅是知识的存储中心,更是智慧的创新中心。随着技术发展进步,智能“数字员工”可能会实现。AI 技术为图书馆这一古老事业注入了新的活力与方向,借助这股新兴力量,图书馆将其积淀的珍贵数据文献进行开发与挖掘,无论是提供基于历史与人文知识的 AI 产品与服务,还是参与大模型的语料训练,图书馆可以把握机遇,更好地完成传承文明和推动知识的创造与传播的使命。图书馆要实现大模型技术的新应用和战略转型,确实面临不小的挑战。首先是数据挑战。AI2.0 时代,数据为王。图书馆原生数据语料积累、资源数据情况、数字化程度、数据质量、信息化水平等直接影响大模型技术的

    188、应用实施效果,需要图书馆推进高质量数字化资源积累,同时实施精细化的数据管理和全面的数据治理策略,以为大模型技术的有效应用打下坚实基础。其次,大模型技术在实际应用中,面临可信评价、评估标准的挑战。需要确定好性能基准,评估标准,衡量大模型在图书馆应用中的有效性与准确性,并建立长期监测与反馈的机制,及时发现并解决大模型应用中的问题。大模型技术的发展仍不成熟,仍在发展,整71个评估过程将是一个持续学习和迭代的过程,根据评估结果不断调整和改进大模型的应用。在应用的进程中,图书馆所面临的数据、评估、隐私、伦理等各类挑战不应该作为回避 AI 的发展借口。“图书馆在未来二十年里,将在知识基础设施建设中,扮演越

    189、来越重要的角色”150,图书馆应该积极研究,塑造并寻找时代角色定位。图书馆应维护和加强其核心价值,既确保信息的可靠性和真实性,同时对隐私、伦理和数据安全等方面保持高度的警觉。图书馆应采用策略性的路径,既要利用大模型技术的强大功能促进知识的普及和教育的创新,也要确保在提供服务的同时尊重和保护用户的信息安全。图书馆应积极拥抱变革。在这个过程中,图书馆应该建立协作团队,不仅应该积极组织机构内合作,还应该积极进行跨机构的联盟合作,构建一个支持性的生态系统。在这个系统中,资源共享和开放创新成为核心要素,要通过跨界合作,整合来自不同机构的独特资源和专业知识。这种合作应当超越图书馆界限,可能包括学术界、技术

    190、供应商、出版社和教育机构的广泛参与。同时,技术支持也是大模型技术落地的关键,图书馆需要构建强大的技术后盾,从而支持复杂数据处理、模型训练和算法优化等高级功能。图书馆参与行业联盟的作用将会日益凸显价值。从这个角度,云瀚社区做了很好的示范,云瀚社区携手图书馆和厂商,共建联盟社区,打造图书馆技术生态。联盟建立“项目池制度”,组织社区力量进行应用模块和专题项目的孵化和研发,并推出“应用商店”,鼓励业界厂商创新应用的开发。当前,云瀚社区推出云瀚本地大模型应用套件,并在应用商店中上线多个云瀚 AI 应用(见附录)。在审视当下大模型技术的飞速进展时,我们认识到,尽管本报告尝试详尽地剖析多个业务场景的需求,但

    191、这仅仅是技术应用广阔前景的一瞥。未来,随着人工智能领域尤其是多模态技术、智能体、具身智能的发展与突破,人工智能技术将极大地拓宽图书馆智能服务与自动化业务的边界,带来深远、革命性和无法预测的变革。150吴建中.未来二十年,图书馆是什么模样?J.图书馆杂志,2023,42(11):4-9.72附:云瀚应用商店附:云瀚应用商店 AI 应用列表应用列表云瀚应用商店于 2024 年 5 月开启内测试运行。本应用商店专注于图书馆业务领域,旨在为云瀚社区成员及行业用户提供丰富的应用选择。平台内容涵盖了丰富的应用程序介绍,展现了每个应用的基本概况、核心功能以及直观的操作界面截图,以便用户全方位了解并选择符合需

    192、求的解决方案。应用商店即将上线多个云瀚 AI 应用。云瀚云瀚 AI 应用简介应用简介小海豚数字馆员数字馆员作为馆员的数字分身,以大语言模型作为其超级大脑,图书馆知识库及业务数据作为数据支持,为读者提供全面而个性化的图书馆服务。ChatBK 智慧咨询为用户提供个性化的检索服务和馆内信息支持。如:AI咨询、AI荐书、AI找书、AI读书等服务,全面促进图书馆资源建设、服务与管理的升级。AIGC 阅读推广创作平台通过文生文、文生图、文生视频和文生音乐等功能,辅助阅读推广馆员高效生成形式丰富的阅推内容,激发读者兴趣。云瀚 AI 助手结合AI算法与图书馆业务知识的移动端工作辅助产品。可以即时访问知识库,查看各种服务的运行状态、统计数据,进行组合操作,成为“云瀚”功能的移动工作台。云瀚本地大模型应用套件云瀚本地大模型应用套件是一款整合多种AI大模型能力的软件平台。支持本地部署,适配多种操作系统与硬件设备,可离线运行,提供一系列基于人工智能的高级功能,帮助用户了解、体验和学习各类AI大模型。(更多应用即将推出)