當前位置:才華齋>計算機>計算機四級>

計算機四級資料庫工程師複習知識點

計算機四級 閱讀(2.36W)

導語:為了幫助大家系統複習計算機等級考試,以下是小編為大家精心整理的計算機四級資料庫工程師複習知識點,歡迎大家參考!

計算機四級資料庫工程師複習知識點

一、資料模型

1.資料模型的三要素

(1)資料結構 資料結構是所研究的物件型別(Object Type)的集合。這些物件和物件型別是資料庫的組成成分。一般可分為兩類:一類是與資料型別、內容和其它性質有關的物件;一類是與資料之間的聯絡有關的物件。前者如網狀模型中的資料項和記錄,關係模型中的域、屬性和關係等。後者如網狀模型中的關係模型(set type)。在資料庫領域中,通常按照資料結構的型別來命名資料模型,進而對資料庫管理系統進行分類。如層次結構、網狀結構和關係結構的資料模型分別稱作為層次模型、網狀模型和關係模型。相應地,資料庫分別稱作為層次資料庫、網狀資料庫和關係資料庫。

(2)資料操作 資料操作是指對各種物件型別的例項(或值)所允許執行的操作的集合,包括操作及有關的操作規則。在資料庫中,主要的操作有檢索和更新(包括插入、刪除、修改)兩大類。資料模型定義了這些操作的定義、語法(即使用這些操作時所用的語言)。資料結構是對系統靜態特性的描述,而資料操作是對系統動態特性的描述。兩者既有聯絡,又有區別。

(3)資料的約束條件 資料的約束條件是完整性規則的集合。完整性規則是指在給定的資料模型中,資料及其聯絡所具有的制約條件和依存條件,用以限制符合資料模型的資料庫的狀態以及狀態的變化,確保資料的正確性、有效性和一致性。

2.概念模型

資料模型是資料庫系統的核心和基礎。每個DBMS軟體都是基於某種資料模型的。為了把現實世界中的具體事物或事物之間的聯絡表示成DBMS所支援的資料模型,人們首先必須將現實世界的事物及其之間的聯絡進行抽象,轉換為資訊世界的概念模型;然後將資訊世界的概念模型轉換為機器世界的資料模型。也就是說,首先把現實世界中的客觀物件抽象成一種資訊結構。這種資訊結構並不依賴於具體的計算機系統和DBMS。然後,再把概念模型轉換為某一計算機系統上某一DBMS所支援的資料模型。因此,概念模型是從現實世界到機器世界的一箇中間層次。現實世界的事物反映到人的大腦之中,然後人們開始認識這些事物,經過選擇、命名、分類和組織等抽象工作之後形成概念模型,並進入到資訊世界。

使用者(user) 關心的是現實世界中的事物、事物的屬性及其相互關係。例如,使用者可能關心他的顧客及其屬性,如顧客地址、銀行帳號等等。使用者也關心自己的`定貨帳目,如誰訂的貨、訂的什麼和訂多少等等。

系統分析員(analyst) 同樣也關心現實世界,但是系統分析員需要分析使用者的資訊需求。作為需求分析的結果,分析員必須以文件的形式對需求進行結構化的描述;這個文件就是資訊模型。

實體(Entity) 實體是構成資料庫的基本元素。實體是指一個存在的東西以區別這個東西所具有的屬性和這個東西與其它東西的聯絡。實體可以是人,也可以是物;可以是實際物件,也可以是概念;可以是事物本身,也可以是指事物之間的聯絡。

屬性(Attribute) 一個實體可以由若干個屬性來刻畫。屬性是相對實體而言的,是實體所具有的特性。

關鍵字(Key) 能唯一地標識實體的屬性的集合稱為關鍵字(或碼)。

域(Domain) 屬性的取值範圍稱作域。

實體型(Entity Type) 一類實體所具有的共同特徵或屬性的集合稱為實體型。一般用實體名及其屬性來抽象地刻畫一類實體的實體型。

實體集(Entity Set) 同型實體的集合叫實體集。例如,學生就是一個實體集。實體集的名即是實體型。對於學生和(學號,姓名,年齡,系,年級)均是實體型,而學生是對實體型(學號,姓名,年齡,系,年級)所起的名稱,兩者是指同一客觀物件。但本科生和研究生可以為相同實體型,而實體集不同。

聯絡(Relationship) 現實世界的事物之間是有聯絡的。一般存在兩類聯絡:一是實體內部的組成實體的屬性之間的聯絡,二是實體之間的聯絡。在考慮實體內部的聯絡時,是把屬性看作為實體。一般來說,兩個實體之間的聯絡可分為三種:

(1)一對一(1∶1)聯絡 若對於實體集A中的每一個實體,實體集B中至多有唯一的一個實體與之聯絡,反之亦然,則稱實體集A與實體集B具有一對一聯絡,記作1∶1。

(2)一對多(1∶n)聯絡 若對於實體集A中的每個實體,實體集B中有n個實體(n≥0)與之聯絡;反之,對於實體集B中的每一個實體,實體集A中至多隻有一個實體與之聯絡,則稱實體集A與實體集B有一對多聯絡,記為1∶n。相應地有多對一(n∶1)聯絡 多對一聯絡,從本質上說,是一對多聯絡的逆轉。其定義同一對多聯絡類似,不再贅述。

(3)多對多(m∶n)聯絡 若對於實體集A中的每一個實體,實體集B中有n個實體(n≥0)與之聯絡;反之,對於實體集B中的每一個實體,實體集A中也有m個實體(m≥0)與之對應,則稱實體集A與實體集B具有多對多聯絡,記作m∶n。實質上,多對多聯絡是任意一種聯絡。另外,同一實體集內的各個實體間也可以有各種聯絡。概念模型的表示方法最常用的是實體一聯絡方法(Entity-Relationship Approach),簡稱E-R方法。該方法是由在1976年提出的。E-R方法用E-R圖來描述某一組織的概念模型。在這裡僅介紹E-R圖的要點。在E-R圖中:

(1)長方形框表示實體集,框內寫上實體型的名稱。

(2)用橢圓框表示實體的屬性,並用有向邊把實體框及其屬性框連線起來。

(3)用菱形框表示實體間的聯絡,框內寫上聯絡名,用無向邊把菱形框及其有關的實體框連線起來,在旁邊標明聯絡的種類。如果聯絡也具有屬性,則把屬性框和菱形框也用無向邊連線上。

3.三種主要的資料模型

實際DBMS所支援的資料模型主要有三種:

層次模型(Hierarchical Model)

網狀模型(Network Model)

關係模型(Relational Model)其中,關係模型是當前DBMS所支援的資料模型的主流。90年代執行的DBMS幾乎都是基於關係模型的。層次模型和網狀模型統稱為非關係模型。非關係模型的結構可以和圖論中的圖相對應,比較直觀,但在理論上不完備,實現效率較低,故此目前很少用。但是最近,層次模型在研究面向物件的DBMS中已得到重視。在關係模型中,資料在使用者的觀點中(或在使用者檢視中)的邏輯結構是一張二維表(Table)。

關係(Relation),對應於平常講的一張表。

元組(Tuple),表中的一行。

屬性(Attribute),表中的一列稱為一個屬性,給每一列起一個名,稱為屬性名。這一列或這個屬性所有可能取的值的集合稱為這個屬性的值域(Domain),值域中的一個元素叫做這個屬性的值。

主關鍵字(Primary Key Attribute或Primary Key),是指能唯一標識一個元組的一個或一組屬性。

分量(Attribute value),是指元組中的一個屬性值。

關係模式(Relational Schema),是對關係的描述,一般用關係名(屬性名1,屬性名2,…,屬性名n)來表示。同層次模型和網狀模型相比較,關係模型具有下列特點:

(1)概念單一 在關係模型中,無論是實體還是實體之間的聯絡都用關係來表示。在關係模型中,在使用者的觀點中,資料的邏輯結構就是表,也只有這唯一的概念。在非關係模型中,使用者要區分記錄型與記錄型之間的聯絡兩個概念;當環境複雜時,資料結構異常複雜,難以掌握。而關係模型,由於概念單一,可以變複雜為直觀、簡單,易學易用。

(2)規範化 所謂關係規範化是指在關係模型中,每一個關係都要滿足一定的條件要求。這些條件被稱為規範條件。對於關係,一個最基本的規範條件是,要求關係中的每一個屬性(或分量)均是不可分的資料項;也就是說不允許表中有表,表是不可巢狀的。

(3)在關係模型中,使用者對資料的操作的輸入和輸出都是表,也就是說,使用者通過操作舊錶而得到一張新表。總之,關係模型概念簡單,結構清晰,使用者易學易用,有嚴格的以數學為基礎的關係理論作指導,便於DBMS的實現。基於關係的DBMS簡化了應用程式設計師的工作,便於資料庫應用系統的設計和維護。故此,關係模型自誕生以後就得到了迅速的發展,成為應用最為廣泛的、唯一的資料模型。