基于翻译的模型-TransE,TransH,TransR,TransD
发布日期:2021-05-10 08:19:18 浏览次数:12 分类:精选文章

本文共 1406 字,大约阅读时间需要 4 分钟。

翻译模型在知识图谱中的应用

1. TransE模型

TransE模型主要认为知识库中的三元组 <h, r, t> 可以看作是头实体 h 到尾实体 t 使用关系 r 进行的翻译。这种模型的核心思想是,通过向量相加的形式,将头实体 h 和关系 r 组合后,得到的结果应该尽可能与尾实体 t 的向量接近。具体而言,TransE的目标是最小化以下损失函数: [ f_r(h, t) = \left| \left| h + r - t \right| \right|_{l_1 / l_2} ] 其中,S 是正例集合(已知三元组),S' 是负例集合(通过随机构造的不符合三元组)。

特点:

  • γ 是间隔参数。
  • γ + fγ(h, t) - f_r(h', t') 要求模型在适当的位置给出预测。
  • 当 f_r(h, t) ≤ 0 时,损失为 0。

局限: TransE模型仅适用于一对一关系,无法处理一对多或多对一关系。例如,在多对一关系中,两个不同的头实体可能映射到同一个尾实体,这样的情况下,模型难以区分两者在其他维度上的差异。

2. TransH模型

TransH模型通过放宽 h + r ≈ t 的严格约束,要求头尾实体在关系 r 的超平面上投影后彼此接近。具体来说,模型引入了法向量 W_r,并对头尾实体向量进行投影:

  • 头实体投影:( h_\bot = h - W_r^T h W_r )
  • 尾实体投影:( t_\bot = t - W_r^T t W_r )
  • 关系投影:( d_r = W_r r W_r )

最终目标是最小化: [ f_r(h, t) = \left| \left| h_\bot + d_r - t_\bot \right| \right|_{l_1 / l_2} ] 这种方法在处理多对一关系时表现更好,但仍存在映射矩阵过大的计算复杂度问题。

3. TransR模型

TransR模型进一步提出将每个关系 r 分配到一个独立的向量空间中。具体而言,头尾实体通过不同的映射矩阵进行投影: [ M_{rh} = M_r^T h + I^{m \times n} ] [ M_{rt} = M_r^T t + I^{m \times n} ] 目标是最小化: [ f_r(h, t) = \left| \left| M_{rh} + r - M_{rt} \right| \right|_{l_1 / l_2} ] 这种方法虽然更灵活,但由于关系矩阵的复杂性,计算量显著增加。

局限:

  • 映射矩阵过大,计算复杂度高。
  • 头尾实体的映射关系仅由关系决定,而忽略了实体本身的特性。

4. TransD模型

TransD针对上述问题提出了映射函数的并行设计。其核心思想是同时考虑实体、关系和映射矩阵,通过投影操作使头尾实体向量能够更好地展现其语义关联。具体来说,映射矩阵的每一个元素都包含了实体和关系信息,通过以下公式进行投影: [ h_\bot = h - W_r^T h W_r ] [ t_\bot = t - W_r^T t W_r ] 最终目标是最小化: [ f_r(h + t) = \left| \left| h_\bot + r - t_\bot \right| \right|_{l_1 / l_2} ]

优势:

  • 实际应用中,头尾实体往往并非同一个实体。
  • 映射矩阵充分包含了实体和关系的信息。
上一篇:Linux HTTP网站——网站基础服务详解
下一篇:Linux Shell编程自动化运维实现——Shell循环

发表评论

最新留言

逛到本站,mark一下
[***.202.152.39]2025年04月28日 14时15分44秒

关于作者

    喝酒易醉,品茶养心,人生如梦,品茶悟道,何以解忧?唯有杜康!
-- 愿君每日到此一游!

推荐文章