质性数据分析软件NVivo教程:基于现有编码模式自动编码

基于现有编码模式的自动编码是一个实验性的功能,你可以尝试使用,它的设计是为了加快大量文本内容的编码过程。

NVivo是一款支持定性研究方法和混合研究方法的软件。它可以帮助您收集、整理和分析访谈、焦点小组讨论、问卷调查、音频等内容。

NVivo最新版下载


基于现有编码模式的自动编码是一个实验性的功能,你可以尝试使用,它的设计是为了加快大量文本内容的编码过程。

了解基于现有编码模式的自动编码

基于模式的自动编码可以让您快速对大量的文本进行近似的 “粗略 “编码,然后您可以对其进行审查和改进。

在您使用基于模式的自动编码之前,您需要先对您的文件进行手动 “试点 “编码。例如,如果您的研究涉及分析100个访谈,您可以对前10个访谈进行手动编码。然后,您可以根据初始编码的编码模式对剩余的访谈进行自动编码。

当您使用现有模式进行自动编码时,NVivo会将每个文本段落–例如,句子或段落–与已经编码的内容与现有编码进行比较。如果文本段落的内容与已经编码的内容在措辞上相似,那么文本段落将被编码为该代码。

在基于模式的自动编码过程中,要编码的内容中的词会与之前编码的代码中的词进行比较。当比较文本内容和现有代码时,停顿词会被忽略。具有相同词干的词–例如房子、房屋和住房–会被归为一组。确保您的项目文本内容语言选择文件 > 项目属性,然后单击常规,然后选择您的来源中使用的语言。 已设置为您要分析的来源的语言。

当比较文本段落与按现有编码编码的内容时,任何早期基于模式的编码都会被忽略,以保持编码模式的质量。

基于现有编码模式自动编码的编码参考文献与用户配置文件 “NVivo “相关联,首字母为 “NV”。

以下是基于模式的自动编码的说明:

质性数据分析软件NVivo教程:基于现有编码模式自动编码

注意:在确定编码模式时,NVivo v1.0还考虑了以下因素:

  • 未编码的内容–确保在运行基于模式的编码之前,您已经完成了对您选择的编码模式所依据的文件的 “试点 “编码。
  • 词组–例如 “水质 “或 “气候变化”。

基于模式的编码在什么情况下会有用/span>

基于模式的自动编码在对描述性编码进行编码时最有用–例如,它可以识别第1段是关于住房的,第2段是关于公共交通的。

您也可以使用基于模式的自动编码来识别那些提到对您的研究很重要的特定人物(如政治家或领导人)、地方或组织的段落。不建议使用基于模式的自动编码对代表以下内容的代码进行编码。

  • Sentiment–例如,积极的,消极的。使用情感分析来代替。
  • 态度、语气或情绪–例如,热情、讽刺、快乐。
  • 对数据的解释–例如,离学校的距离会增加逃学的可能性。
  • 采访记录中的说话人–它不能准确地识别谁在说话。

基于现有编码模式的自动编码策略

在您使用基于模式的自动编码之前,您需要从手动 “试点 “编码文件开始。这里有一些策略需要考虑,当试点编码:

  • 试点编码的质量将影响自动编码结果的质量。
  • 如果你的先导编码太小或重点太窄,你可能会得到较差的结果(或没有结果)。
  • 编码较小的段落–例如,一个句子–可能比编码较大的段落取得更好的结果。
  • 您可以只对与特定主题相关的文本进行编码,从而获得更好的结果。例如,如果一个段落包含两个想法,只对与主题相关的部分进行编码。

如果您的项目涉及反复捕获数据集,您可以对初始数据集进行试编码。例如,如果您以多个时间间隔捕获 Twitter 数据,或从 SurveyMonkey 收集多个收集器的回复,那么您可以手动对初始数据进行试编码,然后对后续数据进行自动编码。

如果您的文件包含对一系列主题或问题的回复,如果您每次使用与该问题相关的特定主题代码对一个问题的回复进行自动编码,您可能会通过基于模式的编码获得更好的结果。例如,如果您有一个数据集,其中包含1000个关于公共政策调查的答复,您可以:

  • 将回答收集成每个问题的代码。您可以通过在选定列的代码中自动编码数据集来实现这一目的。
  • 打开特定问题的代码–例如对议会资金的看法–然后对前 50 个回答进行手动 “编码 “到一组主题代码(动物、图书馆、公园、公共卫生、回收)。
  • 使用基于模式的编码,将问题代码 “对议会资金的看法 “自动编码为该问题的特定主题代码(动物、图书馆、公园、公共卫生、回收)。

您在 “自动编码向导 “中进行的选择会对结果的质量产生影响:

  • 选择您的自动编码–例如,只使用某些主题代码。基于模式的自动编码对主题代码而非关系的效果最好。
  • 实验一下滑块。如果您选择 “较少”,那么NVivo在决定是否对内容进行编码时将应用更严格的标准。
  • 审查用于评估编码相似性的术语列表。拥有一个有针对性的术语列表可以提高基于模式的编码的准确性。

审查自动编码的结果。如果您对结果不满意,请 “撤销 “自动编码操作,或恢复到项目的备份副本。考虑在下次自动编码时,多做一些试点编码或调整自动编码向导中的滑块。、

基于现有的编码模式进行自动编码

注意:

    • 使用现有的编码模式进行自动编码,可以很快地进行大量的编码。在开始之前,最好先对项目进行备份。
    • 如果您在NVivo Collaboration Server项目中工作,您可能希望在自动编码之前专门打开项目–这确保了您可以在对结果不满意时 “撤销 “自动编码。
  • 在列表视图中,选择要自动编码的项目。您可以选择文件、代码或案例。文件不一定是同一文件类型。如果您想从不同的文件夹中选择项目,您可以使用一组。
  • 在 “主页 “选项卡上,在 “编码 “组中,单击 “自动编码”。
  • 按照自动编码向导上的步骤进行操作。
向导步骤 说明
选择您想要的自动编码方式 单击 “使用现有编码模式”。
自动编码文本段落

根据您已经编码的文件选择您要编码的内容,点击 “选择 “并选择以下每个项目的相关项目。

选择你想编码的代码或关系:

  • 选择您想基于编码模式的编码文件–这些文件应该包含手动 “试点 “编码。
  • 调整滑块以影响NVivo将创建多少编码,例如,如果你选择。

Less-NVivo使用较高的阈值来确定每个文本段落与每个代码之间的相似度。

更多-NVivo在比较每个文本段落与每个代码时,使用较低的阈值来确定相似度。

检查现有的编码模式

NVivo检查您选择的编码中现有的编码模式,以确定其是否适合基于模式的编码。

检查完成后,您将收到关于您的代码适用性的反馈。如果检测到任何问题,NVivo会显示一个警告信息–例如,表示某代码的编码不足。

您可以点击 “展开 “按钮,查看每个信息的编码。由于检测到的问题,带有警告的代码将不会被用于编码。但是,如果您仍然想对某一代码进行编码,您可以在向导的这一步中再次选择它。

选择文本段落的编码方式

选择NVivo对文本段落编码的精细程度:

  • 如果您希望对单个句子进行编码,则对句子进行编码。
  • 如果您希望对整个段落进行编码,则对段落进行编码。
  • 如果你想对数据集、成绩单和图片日志的整个单元格进行编码。对于其他文件类型,则对整个段落进行编码。

注意:在选择文本段落的编码方式中,如果您的文本内容语言是中文或日文,您将无法选择 “编码句子”。默认情况下,结果会以编码矩阵的形式保存在 Coding Matrices 文件夹中。您可以清除 “将自动编码结果保存在编码矩阵文件夹 “复选框。但是,如果您清除这个复选框,结果将显示为一个临时编码矩阵,您将无法保存。

使用自动编码的结果

当您基于现有的编码模式进行自动编码时,结果会显示在详细视图中,默认情况下,结果会以编码矩阵的形式保存在编码矩阵文件夹中。如果您想要记录向导在特定日期和时间执行的编码,您可以在以后查看保存的编码矩阵。这个编码矩阵是一个静态记录,如果您随后取消了部分内容的编码,则不会更新。

质性数据分析软件NVivo教程:基于现有编码模式自动编码

1、列显示已被向导编码的代码名称。

2、行显示已被向导编码的文件。

3、单元格显示在一个代码(列)上为一个文件(行)创建的编码引用的数量。您可以改变显示方式,例如在矩阵选项卡上的视图组中,将列和行点击移植。

4、单击 “图表 “选项卡,可以看到自动编码结果的可视化表示。

审查和微调自动编码

最好的办法是审查编码,检查编码参考文献的相关性。基于模式的编码是一项复杂的任务–例如,一个词的含义根据其出现的上下文而变化,因此您可能会看到与代码无关的编码引用。

您可能希望在项目中执行其他操作之前,确认您对自动编码感到满意,以便您可以在需要时撤销自动编码。撤销 “功能最多可以撤销五个最近的操作。另外,如果你在自动编码之前对项目进行了备份,那么你可以恢复备份副本。

下面是你可能想要采取的一种方法来审查结果:

  • 回顾已经编码的内容。双击矩阵中的一个单元格,查看被编码到文件和代码交叉点的内容。这些内容与该代码相关吗看矩阵中的其他单元格。
  • 决定你是否对结果满意–你是想保留部分编码还是撤销整个自动编码操作/li>
    • 如果您对结果基本满意,但需要对一些自动编码进行微调,您可能会想取消一些引用的编码。即使您取消了编码,编码引用仍然会显示在单元格的详细视图中。如果您想查看基于模式的编码所产生的编码引用–不包括未编码的引用–请参考如何识别基于模式的编码引用/li>
    • 如果您对整体结果不满意,您可能想完全 “撤销 “自动编码。在再次尝试之前,您可能想参考基于现有编码模式的自动编码策略。

为什么我从基于模式的编码中得到了意想不到的结果/span>

基于模式的自动编码使用机器学习算法来寻找您之前在项目中编码的现有编码模式。 然后使用编码模式来确定进一步的编码。你可能会得到意想不到的结果,因为算法会受到以下因素的影响。

  • 你项目中编码的质量(不相关的内容可能会影响结果)。
  • 您项目中的编码量
  • 你的文件中是否存在广告。如果您正在处理网页,在导入项目之前,请只捕捉网页上的主要内容。
  • 具有多重含义的单词–一个单词的含义可能会因上下文的不同而不同。
  • 代码中单词的唯一性–如果你的代码主要包含相同的单词,那么算法就更难识别模式了

如何识别基于模式的编码参考/span>

向导基于编码模式创建的编码引用与用户配置文件’NVivo’相关联,首字母为’NV’。

如果您执行了多个基于模式的编码操作,您将无法区分哪些参考文献是由特定模式编码操作创建的。要查看某项操作的引用,可以在编码矩阵文件夹中查看具体的编码矩阵。

您可以运行矩阵编码查询来显示当前与用户 “NVivo “相关联的编码引用。例如:

  • 如果您在文件上使用了基于模式的编码,那么就以行显示文件,以列显示您编码的代码。在 “列 “选项卡上,当选择您的列时,只显示用户 “NVivo “的编码。
  • 如果您使用基于模式的编码操作从单个问题代码中 “编码”,则在行中显示问题代码,在列中显示您编码的代码。在 “列 “选项卡上,选择列时,只显示用户 “NVivo “的编码。

你可以识别基于模式的编码参考的其他方式:

  • 在文件或代码中,显示编码条纹。您可以使用子条纹来查看进行编码的用户。
  • 在代码中,过滤内容,只显示与用户 “NVivo “相关联的编码。
  • 运行一个预定义的报告–例如,按代码或按文件的编码摘要–并对进行编码的用户进行过滤。

包含质性分析软件NVivo的算法专题已建立,点击此处立即到达!

想要购买NVivo正版授权的朋友,或者获取更多该产品相关信息的朋友可以点击咨询在线客服 >>

关注慧聚IT微信公众号了解产品的最新动态及最新资讯。

标签:

来源:慧都

声明:本站部分文章及图片转载于互联网,内容版权归原作者所有,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2021年1月24日
下一篇 2021年1月24日

相关推荐

发表回复

登录后才能评论