案例 2019-12-04 08:26:39
目前最常用的三种数据模型为层次模型、网状模型和关系模型。
一、层次模型
层次模型将数据组织成一对多关系的结构,层次结构采用关键字来访问其中每一层次的每一部分。
优点是存取方便且速度快;结构清晰,容易理解;数据修改和数据库扩展容易实现;检索关键属性十分方便。
二、网状模型
网状模型用连接指令或指针来确定数据间的显式连接关系,是具有多对多类型的数据组织方式。
优点是能明确而方便地表示数据间的复杂关系。
三、关系模型
关系模型以记录组或数据表的形式组织数据,以便于利用各种地理实体与属性之间的关系进行存储和变换,不分层也无指针,是建立空间数据和属性数据之间关系的一种非常有效的数据组织方法。
优点在于结构特别灵活,概念单一,满足所有布尔逻辑运算和数学运算规则形成的查询要求;能搜索、组合和比较不同类型的数据;增加和删除数据非常方便。
发展
数据库技术发展至今,主要有三种数据模型:层次数据模型、网状数据模型、关系数据模型。层次模型发展最早,它以树结构为基本结构,典型代表是IMS模型。由于多数实际问题中数据间关系不简单地是树型结构,层次型数据模型渐被淘汰。
网状数据模型通过网状结构表示数据间联系,开发较早且有一定优点,目前使用仍较多,典型代表是 DBTG模型。
关系模型开发较晚,它是通过满足一定条件的二维表格来表示实体集合以及数据间联系的一种模型,具有坚实的数学基础与理论基础,使用灵活方便,适应面广,所以发展十分迅速。
目前流行的一些数据库系统,如ORACLE、SYBASE、INGRESS、INFORMIX以及具有“大众数据库”之称的dBASE Ⅲ等都属于关系型数据库。
层次类型
数据模型按不同的应用层次分成三种类型:分别是概念数据模型、逻辑数据模型、物理数据模型。
参考资料:百度百科-数据模型
数据库管理系统常见的数据模型有层次模型、网状模型和【关系模型 】3种
数据模型是对现实世界数据的模拟,是一个研究工具,利用这个研究工具我们可以更好地把现实中的事物抽象为计算机可处理的数据。
层次模型以“树结构”表示数据之间的联系
层次模型是数据库系统最早使用的一种模型,它的数据结构是一棵“有向树”。根结点在最上端,层次最高,子结点在下,逐层排列。
层次模型的特征是:
在一个层次模型中的限制条件是:
(1)有且仅有一个节点,无父节点,它为树的根;(有且仅有一个结点没有双亲,该节点就是根结点。)
(2)其他节点有且仅有一个父节点。(根以外的其他结点有且仅有一个双亲结点
)这就使得层次数据库系统只能直接处理一对多的实体关系。
(3)任何一个给定的记录值只有按照其路径查看时,才能显出它的全部意义,没有一个子女记录值能够脱离双亲记录值而独立存在。
比如:一个教师学生层次模型。该层次模型有4个记录类型,即实体。
分别是:
(1)记录型(实体)系是根结点,由编号、名称、专业、人数属性(字段)组成。它有两个子结点,分别是学院老师实体和课程实体。
(2)记录型(实体)教师是学院的子结点,它有6个属性(字段)组成。
(3)记录型(实体)课程由4个属性(字段)组成。
(4)记录型(实体)教师由6个属性(字段)组成。课程与教师是叶子结点,由学院到老师、老师到课程都是一对多的联系。
数据完整性约束
其主要四个功能:增删查改;要满足完整性约束条件;
增加(插入):满足必须有双亲节点,即如果加入教师,就必须分配到学院中;
删除:如果是字节点,不影响,直接删除字节点,如果是双亲节点,则整个字节点被删除;如果删除整个教研室则教研室的老师不存在这个体系;
查找:根据树状结构自上而下查找;
修改:更新相应的关系的信息。
其优缺点:
优点:
比较简单,容易使用;
结构清晰,现实中公司、家族等都存在类似结构;
良好的完整性支持;
查询效率高,模型层次是有向边,常记录存取路径。
缺点:
有很多不是单向关系,一对多,多对一,只能通过引进冗余数据或建非自然的数据组织如创建虚拟节点的方法来解决,易产生不一致性;
插入删除限制太多
查找字节点必须通过双亲;
树结点中任何记录的属性是不可再分的简单数据类型;
网状模型是以“图结构”来表示数据之间的联系。
1、条件特征
(1)允许有一个以上的节点无双亲。
(2)至少有一个节点可以有多于一个的双亲。
网状模型中每个结点表示一个记录型(实体),每个记录型可包含若干个字段(实体的属性),结点间的连线表示记录类型(实体)间的父子关系。
从定义可以看出,层次模型中子结点与双亲结点的联系是唯一的,而在网状模型中这种联系可以不唯一。因此,在网状模型中要为每个联系命名,并指出与该联系有关的双亲记录和子记录。
2、表示方法:
实体型:用记录类型描述
每个结点表述一个记录类型(实体);
属性:用字段描述,每个记录类型包含若干个字段;
联系:用结点之间的连线表示记录类型(实体)之间的一对多的父子关系;
网状模型与层次模型的区别:
网状模型:允许多个结点没有双亲结点;
允许结点有多个双亲;
允许两个结点有多种联系(复合联系);
可以更直接的去描述现实世界;
层次模型是网状模型的一个特例。
要为每个联系命名(L1、L2),并指出该联系相关的双亲记录和子女记录。
3、多对多在网状模型的表示
用网状模型表示多对多的关系
方法:将多对多直接分解成一对多的联系
4、 举例:学生选课模型
它由3个数据项组成,即学号、课程号、成绩,表示某个学生选修某一门课程及其成绩。
每个学生可以选修多门课程。显然对于学生记录中的一个值,选课记录中可以有多个值与之联系。而选课记录中的一个值,只能与学生记录中的一个值联系。学生与选课之间的联系是一对多的联系,联系名为学生-选课。同样,课程与选课之间的联系也是一对多的联系,联系名为课程-选课。
5、操纵
网状模型的数据操作主要包括查询、插入、删除和更新:
插入:插入尚未确定双亲结点值的子结点值;
删除:只允许删除双亲结点值。如可删除一个教研室,而该科研室所有教师的信息仍保留在数据库中。
修改:可直接表示非树状结构,而无须像层次模型那样增加冗余结点,因此修改操作时只需要指定更新记录即可。
网状数据系统(DBTG)对数据加了一些限制,提供了一定的完整性约束:
码:唯一标识记录的数据项集合;
一个联系中双亲记录和子女记录是一对多的关系;
支持双亲记录和子女记录之间的某些约束性条件;
关键:实现记录联系;
常用方法:单向、双向、环向、向首链接;
6、优缺点
网状数据模型的优点如下:
(1) 能够更为直接地描述现实客观世界,可表示实体间的多种复杂联系。
(2) 具有良好的性能,存取效率较高。
网状数据模型的缺点如下:
(1) 结构比较复杂,其数据定义语言(DDL)、数据操作语言(DML)复杂,用户不容易使用。而且应用环境越大,数据库的结构就变得越复杂,不利于最终用户掌握。
(2) 数据独立性差,由于实体间的联系本质上是通过存取路径表示的,因此应用程序在访问数据时要指定存取路径。
关系模型是用“二维表”(或称为关系)来表示数据之间的联系的。
1、基本术语
(1)关系(Relation):一个关系对应着一个二维表,二维表就是关系名。
(2)元组(Tuple):在二维表中的一行,称为一个元组。
(3)属性(Attribute):在二维表中的列,称为属性。属性的个数称为关系的元或度。列的值称为属性值;
(4)(值)域(Domain):属性值的取值范围为值域。
(5)分量:每一行对应的列的属性值,即元组中的一个属性值。[2]
(6)关系模式:在二维表中的行定义,即对关系的描述称为关系模式。一般表示为(属性1,属性2,......,属性n),如老师的关系模型可以表示为教师(教师号,姓名,性别,年龄,职称,所在系)。
(7)键(码):如果在一个关系中存在唯一标识一个实体的一个属性或属性集称为实体的键,即使得在该关系的任何一个关系状态中的两个元组,在该属性上的值的组合都不同。
(8)候选键(候选码):若关系中的某一属性的值能唯一标识一个元组如果在关系的一个键中不能移去任何一个属性,否则它就不是这个关系的键,则称这个被指定的候选键为该关系的候选键或者候选码。
例如下列学生表中“学号”或“图书证号”都能唯一标识一个元组,则“学号”和“图书证号”都能唯一地标识一个元组,则“学号”和“图书证号”都可作为学生关系的候选键。
而在选课表中,只有属性组“学号”和“课程号”才能唯一地标识一个元组,则候选键为(学号,课程号)。
2、关系模型的数据操作与完整性约束
关系数据模型的操作主要包括查询、插入、删除和修改数据;这些操作必须满足关系的完整性约束条件。
关系模型中数据操作的特点是集合操作方式,即操作对象和操作结果都是集合,这种操作方式也称为一次一集合的方式。
相应地,非关系数据模型的操作方式是一次一记录的方式。
关系的完整性约束条件包括三大类:
实体完整性、参照完整性和用户定义的完整性。
实体完整性定义数据库中每一个基本关系的主码应满足的条件,能够保证元组的唯一性。参照完整性定义表之间的引用关系,即参照与被参照关系。用户定义完整性是用户针对具体的应用环境制定的数据规则,反映某一具体应用所涉及的数据必须满足的语义要求。
3、关系模型的优缺点
优点
(1) 关系模型与非关系模型不同,它是建立在严格的数学理论基础上的。
(2) 关系模型的概念单一,实体与实体间的联系都用关系表示,对数据的检索结果也是关系(即表),所以其数据结构简单、清晰,用户易懂易用。
(3) 关系模型的物理存储和存取路径对用户透明,从而具有更高的数据独立性、更好的安全保密性,简化了程序员的数据库开发工作。
缺点
(1) 由于存取路径对用户透明,查询效率往往不如非关系数据模型高。因此,为了提高性能,必须对用户的查询请求进行优化,这就增加了开发数据库管理系统的难度和负担。
(2) 关系数据模型不能以自然的方式表示实体集间的联系,存在语义信息不足、数据类型过少等弱点。
数据模型所描述的内容包括三个部分:数据结构、数据操作、数据约束。
1、数据结构
主要描述数据的类型、内容、性质以及数据间的联系等,是目标类型的集合。目标类型是数据库的组成成分,一般可分为两类:数据类型、数据类型之间的联系。
数据类型如DBTG(数据库任务组)网状模型中的记录型、数据项,关系模型中的关系、域等。联系部分有DBTG网状模型中的系型等。数据结构是数据模型的基础,数据操作和约束都基本建立在数据结构上。不同的数据结构具有不同的操作和约束。
2、数据操作
数据模型中数据操作主要描述在相应的数据结构上的操作类型和操作方式。它是操作算符的集合,包括若干操作和推理规则,用以对目标类型的有效实例所组成的数据库进行操作。
3、数据约束
数据模型中的数据约束主要描述数据结构内数据间的语法、词义联系、他们之间的制约和依存关系,以及数据动态变化的规则,以保证数据的正确、有效和相容。它是完整性规则的集合,用以限定符合数据模型的数据库状态,以及状态的变化。
约束条件可以按不同的原则划分为数据值的约束和数据间联系的约束;静态约束和动态约束;实体约束和实体间的参照约束等。
层次类型:
数据模型按不同的应用层次分成三种类型:分别是概念数据模型、逻辑数据模型、物理数据模型。
1、概念模型
概念模型是一种面向用户、面向客观世界的模型,主要用来描述世界的概念化结构,它是数据库的设计人员在设计的初始阶段,摆脱计算机系统及DBMS的具体技术问题。
概念模型用于信息世界的建模,一方面应该具有较强的语义表达能力,能够方便直接表达应用中的各种语义知识,另一方面它还应该简单、清晰、易于用户理解。
2、逻辑模型
逻辑模型是一种面向数据库系统的模型,是具体的DBMS所支持的数据模型,如网状数据模型(Network Data Model)、层次数据模型(Hierarchical Data Model)等等。此模型既要面向用户,又要面向系统,主要用于数据库管理系统(DBMS)的实现。
3、物理模型
物理模型是一种面向计算机物理表示的模型,描述了数据在储存介质上的组织结构,它不但与具体的DBMS有关,而且还与操作系统和硬件有关。
每一种逻辑数据模型在实现时都有其对应的物理数据模型。DBMS为了保证其独立性与可移植性,大部分物理数据模型的实现工作由系统自动完成,而设计者只设计索引、聚集等特殊结构。
参考资料来源:百度百科--数据模型
zhidao
文章:57 问答:0
Copyright 模型组 2006-2024 All Rights Reserved ICP证:蜀ICP备2023015644号-7
四川鑫众焱信息技术服务有限公司| 地址:绵阳市涪城区瀚威城市中心1栋1单元42层2号