
本文共 1406 字,大约阅读时间需要 4 分钟。
翻译模型在知识图谱中的应用
1. TransE模型
TransE模型主要认为知识库中的三元组 <h, r, t>
可以看作是头实体 h
到尾实体 t
使用关系 r
进行的翻译。这种模型的核心思想是,通过向量相加的形式,将头实体 h
和关系 r
组合后,得到的结果应该尽可能与尾实体 t
的向量接近。具体而言,TransE的目标是最小化以下损失函数: [ f_r(h, t) = \left| \left| h + r - t \right| \right|_{l_1 / l_2} ] 其中,S
是正例集合(已知三元组),S'
是负例集合(通过随机构造的不符合三元组)。
特点:
- γ 是间隔参数。
- γ + fγ(h, t) - f_r(h', t') 要求模型在适当的位置给出预测。
- 当 f_r(h, t) ≤ 0 时,损失为 0。
局限: TransE模型仅适用于一对一关系,无法处理一对多或多对一关系。例如,在多对一关系中,两个不同的头实体可能映射到同一个尾实体,这样的情况下,模型难以区分两者在其他维度上的差异。
2. TransH模型
TransH模型通过放宽 h + r ≈ t 的严格约束,要求头尾实体在关系 r
的超平面上投影后彼此接近。具体来说,模型引入了法向量 W_r
,并对头尾实体向量进行投影:
- 头实体投影:( h_\bot = h - W_r^T h W_r )
- 尾实体投影:( t_\bot = t - W_r^T t W_r )
- 关系投影:( d_r = W_r r W_r )
最终目标是最小化: [ f_r(h, t) = \left| \left| h_\bot + d_r - t_\bot \right| \right|_{l_1 / l_2} ] 这种方法在处理多对一关系时表现更好,但仍存在映射矩阵过大的计算复杂度问题。
3. TransR模型
TransR模型进一步提出将每个关系 r
分配到一个独立的向量空间中。具体而言,头尾实体通过不同的映射矩阵进行投影: [ M_{rh} = M_r^T h + I^{m \times n} ] [ M_{rt} = M_r^T t + I^{m \times n} ] 目标是最小化: [ f_r(h, t) = \left| \left| M_{rh} + r - M_{rt} \right| \right|_{l_1 / l_2} ] 这种方法虽然更灵活,但由于关系矩阵的复杂性,计算量显著增加。
局限:
- 映射矩阵过大,计算复杂度高。
- 头尾实体的映射关系仅由关系决定,而忽略了实体本身的特性。
4. TransD模型
TransD针对上述问题提出了映射函数的并行设计。其核心思想是同时考虑实体、关系和映射矩阵,通过投影操作使头尾实体向量能够更好地展现其语义关联。具体来说,映射矩阵的每一个元素都包含了实体和关系信息,通过以下公式进行投影: [ h_\bot = h - W_r^T h W_r ] [ t_\bot = t - W_r^T t W_r ] 最终目标是最小化: [ f_r(h + t) = \left| \left| h_\bot + r - t_\bot \right| \right|_{l_1 / l_2} ]
优势:
- 实际应用中,头尾实体往往并非同一个实体。
- 映射矩阵充分包含了实体和关系的信息。
发表评论
最新留言
关于作者
