# 文件和内容管理

文件和内容管理是指针对存储在关系型数据库之外的非结构化或线下数据和信息采集、存储、访问和使用过程管理。它的重点在于保持文件和其他非结构化信息的完整性,并使这些信息能够被访问。在许多组织中,非结构化数据和结构化数据有着直接的关系,有关内容的管理决策应同样适用于非结构化数据的管理要求。如同其他类型的数据一样,文件盒非结构化内容也应是安全且高质量的。

# 目标和原则

文件和内容管理的主要业务驱动因素包括法规遵从性要求、诉讼响应能力和电子取证请求能力以及业务连续性要求。良好的档案管理还可以帮助组织提高效率。法律法规要求组织保留某些活动的档案,档案包括纸质文件和电子存储信息。

提高效率是改进文件管理的驱动力,文件管理方面的技术进步,有助于组织简化流程、管理工作流、消除重复性的手动任务并实现协作。这些方式让人们能够快速定位、访问和共享文件,同时还可以防止文件丢失。

综上所述,实施文件和内容管理最佳实践的目标包括

  1. 确保能够高速有效地采集和使用非结构化的数据和信息。
  2. 确保结构化和非结构化数据之间的整合能力。
  3. 遵守法律义务并达到设定预期。

文件和内容管理遵循以下指导原则

  1. 问责原则。组织应派适当的高级管理人员,采用制度和流程来指导员工,并确保管理计划的可审计性。
  2. 完整原则。使组织创建或管理档案和信息具有合理性,以及适当的真实性和可靠性保证。
  3. 保护原则。确保对个人信息或其他需要保护的信息提供合理的保护。
  4. 遵从原则。遵从使用的法律法律和其他有约束力的机构及组织的制度要求。
  5. 可用原则。组织应确保及时、高效和准确检索其信息的原则来维护其信息。
  6. 保留原则。组织的信息应保留适当的时间,并考虑所有运营、法律、监管和财政以及其他所有相关约束的要求。
  7. 处置原则。组织应根据其制度、适用的法律法规以及其他有约束力的机构要求,提供安全和适当的信息处置。
  8. 透明原则。组织应以工作人员和利益相关方可以理解的方式记录其制度、流程和活动,并将信息进行及时同步。

# 基本概念

# 内容管理

内容管理包括用于组织、分类金额构造信息资源的流程、方法和技术,以便以多种方式存储、发布和重复使用这些资源。

内容的生命周期可以是动态的,通过受控的创建和修改流程进行日常更改,它们也可以是静态的,只是发生很少或偶尔的更改,内容可以被正式的管理或通过临时更新的方式进行非正式的管理。内容管理在网站或门户中尤为重要,基于关键字的索引和基于分类的组织方法可以跨技术平台应用。

# 内容元数据

元数据对于管理非结构化数据至关重要,无论是传统上认为的内容和文件,还是现在理解的大数据,如果没有元数据,就无法对内容进行编目和组织,非结构化数据内容的元数据主要基于:

  • 格式。通常数据格式决定了访问数据的方法,如PDF中的电子索引。
  • 可搜索性。是否已经具备用于搜索相关非结构化数据的工具。
  • 自我描述性。元数据是否具有自我描述能力,通过自我描述能力可以有效识别数据的定义。
  • 既有模式。是否可以采用或者适配现有的方法和模式。
  • 内容主题,数据的主要标识。

# 内容建模

内容建模是将逻辑内容概念转换为具有关系的内容类型、属性和数据类型的过程。属性描述了关于该内容的一些特定的和可区分的信息。数据类型限制了属性可以包含的数据类型,从而使验证和处理成为可能。

内容建模包含两个层次,第一个是信息产品级别,第二个是组件级别。模型中的详细程度取决于重用和构造所需的粒度。内容模型通过指导内容创建并促进内容的再利用来支持内容管理制度。

# 受控词表

受控词表源自柏林核心元素集,是用于通过流量和搜索对内容进行索引、分类、标引、排序和检索术语的定义列表。它可以系统的组织文件、档案和内容。

在理想情况下,受控词表应于企业概念数据模型中的实体名称和定义保持一致,它构成了参考数据的一个类型,需要管理它们的值和定义,以确保完整性和时效性。词汇表需要体现出其支持哪些信息概念,以及词汇表的受众群体和首选术语。

# 同义词环和规范表

同义词环是指一组含义大致相同的术语。同义词环运行搜索其中一个术语的用户去访问与该词环其他术语相关的内容。制作同义词环手册的目的是用于检索,提供同义词或近似词控制。

规范表是描述性术语的受控词汇表,旨在促进特定领域或范围内的信息检索。其术语处理方法和同义词环不同,其是一个交叉引用表,以指引用户选择优选术语。另外,规范表有制定的管理者对其定期维护。

# 主题词表

主题词表是一种用于内容检索的受控词表,它结合了同义词列表和分类方案的特征,主题词表提供相关的每个术语及其他术语的关系信息,关系要么是层次关系,要么是关联关系或等价关系。在所有语境场景中,同义词必须是可接受的等价词。