软件智能:aaas系统中的数学程序与技术服务之4 序篇之 综述2 词典lexicon

本篇是上一篇“之3 序篇之 综述1 词汇和符号的标准化及其开发方法”中所说的”的接续,即,将说明前面的“之2 序篇之 引言-aaas内核”篇中提到的的各种词,目的是要将它们归入到词典lexicon中。链接:(该篇在原文的基础上做了比较大的修改)。两篇的链接:

软件智能:aaas系统中的数学程序与技术服务之3 序篇之 综述1 词汇和符号的标准化及其开发方法_ChuanfangChen的博客-CSDN博客

软件智能:aaas系统中的数学程序与技术服务之2 序篇之 引言-aaas内核_ChuanfangChen的博客-CSDN博客

一、语言游戏和人工语言

1.1 语言游戏-词典歧义的消歧

自然语言是最终的知识表示语言可以用任何人工语言符号表达的任何东西everything ,都可以用自然语言以同样的精度表达出来。然而,对于许多应用程序,人工语言可以更简洁,或者更好地订制需求。理解自然语言和人工语言之间关系的一个关键是语言游戏language games理论:一个自然语言的语义包括所有可能的语言游戏的总和,这些游戏可以用给定的语法和词汇vocabulary进行,但是一个人工语言是为单语言游戏设计的。自然语言的词典歧义 lexical ambiguities源于在多个游戏中以多种方式使用和重用相同的单词。这些歧义可以通过将话语discourse 限制在一个单一语言游戏或一组有限的紧密相关的游戏(称为子语言 a sublanguage)中来消除

1.2 人工语言artificial language

词汇词lexical索引词indexical概念词conceptual,是aaas中的三种人工语言, 统称一般术语 term,给出aaas中受控自然语言的三个版本,是逻辑上等价前述谓词(前述谓经验或先验对象)或前语义表征词。

前语言的语义表征的假设在说出口语或写出书面语之前的经验本身以及经验所相像likeness的对象都是一样的,这种表征被叫做什么不重要,重要的是其表现力、拓扑结构以及可以用它(with it )和在它上面(on it)执行的操作的种类(在aaas中使用 topstoposlogos三种分区来表示它们,具体内容在中间表的色度表中给出)。它们就是符号学的研究对象–标志signs,也是胡塞尔所说的內时间意识–关于意识的前述谓经验。

而口语和书面语则是后期 时间-意识的被动综合(passive synthesis of time-consciousness),它们不仅是关于意识的前述谓经验的(pre-predicative experience of consciousness),更是关涉作为现象学根基basis的自我的原构成的(the primal constitution of ego)。 (三个阶段 分别导向工程建筑术 sign符号学和 现象诠释学,具体内容在中间表的角表中给出)

二、词典lexicon

词典是关于在一个自然语言的词汇表vocabulary中的某些单词 子集(语言游戏的结果)的一个知识库。

(为了区别lexicon和vocabulary,将前者译为词典,后者译为词汇。)

2.1 组成部分-单一的【Component】-集群方案-本体论的

词典的一个组成部分是术语本体(terminological ontology,形式本体论)-其概念类型表征词汇中的词义。(One component of a lexicon is a terminological ontology whose concept types represent the word senses in the lexicon)

一个术语本体,其类别以逻辑或某些面向计算机的语言(它们可以自动翻译成逻辑) )中的公理和定义来区分。逻辑的复杂性没有限制,可以用来陈述公理和定义。

形式本体论发展的两个主要贡献者是标志sign符号学(贡献了索引词)和现象诠释学(贡献了概念词)。(aaas中的三种参与者:劳动者开发者贡献者)。

形式本体论的例子包括科学和数学理论、专家系统中规则和框架的集合以及SQL中数据库架构的一个规范。

2.2 包含-紧密内联的【Composite】-聚合方案-决定论的

词典还可能包含有关单词语法、拼写、发音和用法的附加信息。除了传统字典外,词典还包括大量的单词和词义的集合collection:如 从文献的题目、正文或摘要中抽取出来的最基本的、其概念不可再分的单元词和从句子成分中分析出来的中心词。它们是一个词典除了要包括传统字典以外的聚合(含组合)方案。

中心词和单元词

每一个中心词都是一个特定域的一个聚合根,每一个单元词都是词典的一个主要组成部分。和传统词典中的单词一样,中心词和单元词一般都未经规范化,也未经概念化(无词表)。。

  • 单元词:单元词是组织法,用于组配检索(作为主体)。 检索时,根据检索课题的内容特征,选取恰当的单元词进行组配检索。【整分论版本】
  • 中心词:中心词是分析法,用于组合句子(作为主词)。中心词分析法又叫做句子成分分析法, 是传统语法学使用的句子分析方法–认为句子与句子成分之间存在对应关系, 主语和谓语是主要成 分,宾语和补语是次要成分,定语和状语是附加成分。【集合论版本】

它们和决定论有关。在两种决定论中具有不同的意义:

  • 认识决定论中, 二者分别对应于 用来分类认知prehensions的两种固有的(内在的)实体。此时两者的关系直接是一个has关系,后者(已把握的单元词)has前者(预测中的中心词)。
  • 逻辑决定论中,二者是正确规定种种概念能够相互归属的关系的的依据,即依据了哪一种知识能力而在主观上相互归属的。对应的两种知识能力分别是:与生俱来的感性知识能力和知性知识能力, 前者把握后者。此时两者的关系是一个间接关系(通过把握的结果–role建立)–case关系,亦即主题角色。

2.3 包括-松散外联的【Correlative】-分类方案- 表征论的

词典的其它例子包括分类方案,如前述图书馆目录方式中文献的主题标题(subject headings)或 专业学科的主题标题(Subject Headers)。(对应于表征论的;两个版本:  弱表征和强表征论)

也就是前一阶段讲过的aaas文档主体标头标记法DSHN。

在语言学中,它们分别就是 关键词(普通名词或名词复数)和叙词(专业名词或二元谓词)。

2.4 词典的体及其 三个分位【三位一体】

词典的主体(关于在一个自然语言的词汇表中的某些单词子集的一个知识库),在逻辑上对应于描述逻辑(利用T-box和A-box来 存储 术语terminology和断言assertion),在语言学上,是通过主题词来组织的。

字典的三位一体中的三位,对应于前面的“之2 序篇之 引言-aaas内核”篇中的三个库的主词 及其方法汇总如下:

  1. 叙词法【学科标头。分类学taxonomy(概观-关系型,表征的顶级范畴tops)】:单元词的形成become--后组式主题法,一般未经规范化。分类的叙词库
  2. 主题法【文章标题。形学profile (概貌-知识库,呈现的表面地形topos)】 标题词语 的形式 to be–先组式的词语, 规范语言。是在标引和检索中用以表达文献主题的人工语言,具有概念化规范化的特征(含词表-table)。领域的知识库
  3. 关键词法  【文本注解–文献标示。 图书馆学nomenclature(概要-概念域,突出的易感特色logos) 】:标示的图式  being–词语的出现。后组式主题法规范化的和标准化的 (含词表  和词典-矩阵) 。注解的语料库。特指单个媒体在制作使用索引时,所用到的词汇。是图书馆学中的词汇。

【——–未完待续—————】

文章知识点与官方知识档案匹配,可进一步学习相关知识云原生入门技能树首页概览8597 人正在系统学习中

来源:一水鉴天

声明:本站部分文章及图片转载于互联网,内容版权归原作者所有,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2022年2月9日
下一篇 2022年2月9日

相关推荐