
本文共 872 字,大约阅读时间需要 2 分钟。
技术文档 - 概念概述
概念概述
我们的目标是为AI应用开发人员和研究人员提供:
一个预训练的NLP模型集合
预定义的对话系统组件(基于规则、机器学习或深度学习)通用的对话流程模板一个实现与测试对话模型的框架
与邻近基础设施(如信使平台、帮助台软件等)集成的应用工具
一个会话模型的基准测试环境以及相关数据集的统一访问权限
关键概念
对话代理(Agent)是由自然语言(文本)与用户进行交互的智能实体
技能(Skill)是在特定领域中帮助实现用户目标的功能模块。通常,这可以通过提供相关信息或完成交易来实现(例如回答常见问题、预订机票等)。但对于某些任务,交互的成功标准则定为持续的用户参与(例如闲聊)。
模型(Model)是指任何不一定用自然语言与用户交互的NLP工具
组件(Component)是模型或技能中可以重用的功能模块
基于规则的模型无法进行训练
机器学习模型只能单独训练
深度学习模型既可以独立训练,也可以按端到端方式加入到对话流程中
技能管理器负责根据用户输入选择合适的技能来生成回答
Chainer是一个构建对话代理/模型管道(基于规则、机器学习或深度学习)的框架。它能够对整个管道进行联合训练与推理操作
库的最小构建单元是组件。组件可以指代任何NLP流程中的功能模块,通常可以实现为神经网络、机器学习模型或基于规则的系统
组件可以连接到模型或技能中。与组件相比,模型通常负责处理更复杂的NLP任务。然而,从实现角度来看,模型与组件没有本质区别。技能和模型的主要区别在于,其输入和输出必须是字符串类型。因此,技能通常与对话任务直接相关。
对话代理是一个多功能对话系统,包含多个技能可供切换,并根据用户输入选择合适的技能来生成回答。它可以同时具备目标导向技能(如回答问题、预订票等)和聊天机器人功能(如闲聊)。
DeepPavlov框架依托TensorFlow和Keras机器学习库构建,此外也支持使用其他外部库来开发基础组件。
发表评论
最新留言
关于作者
