當前位置:才華齋>計算機>計算機四級>

全國計算機四級《資料庫工程師》考試重點

計算機四級 閱讀(1.01W)

《資料庫工程師》是計算機四級考試中的科目之一,同學們在備考的時候要了解其考試重點,明確備考的方向,才能有針對性地進行備考。下面是本站小編為大家搜尋整理的關於《資料庫工程師》考試重點,歡迎參考學習,希望對大家有所幫助!想了解更多相關資訊請持續關注我們應屆畢業生考試網!

全國計算機四級《資料庫工程師》考試重點

  一、資料模型

1.資料模型的三要素

(1)資料結構 資料結構是所研究的物件型別(Object Type)的集合。這些物件和物件型別是資料庫的組成成分。一般可分為兩類:一類是與資料型別、內容和其它性質有關的物件;一類是與資料之間的聯絡有關的物件。前者如網狀模型中的資料項和記錄,關係模型中的域、屬性和關係等。後者如網狀模型中的關係模型(set type)。在資料庫領域中,通常按照資料結構的型別來命名資料模型,進而對資料庫管理系統進行分類。如層次結構、網狀結構和關係結構的資料模型分別稱作為層次模型、網狀模型和關係模型。相應地,資料庫分別稱作為層次資料庫、網狀資料庫和關係資料庫。

(2)資料操作 資料操作是指對各種物件型別的例項(或值)所允許執行的操作的集合,包括操作及有關的操作規則。在資料庫中,主要的操作有檢索和更新(包括插入、刪除、修改)兩大類。資料模型定義了這些操作的定義、語法(即使用這些操作時所用的語言)。資料結構是對系統靜態特性的描述,而資料操作是對系統動態特性的描述。兩者既有聯絡,又有區別。

(3)資料的約束條件 資料的約束條件是完整性規則的集合。完整性規則是指在給定的資料模型中,資料及其聯絡所具有的制約條件和依存條件,用以限制符合資料模型的資料庫的狀態以及狀態的變化,確保資料的正確性、有效性和一致性。

2.概念模型

資料模型是資料庫系統的核心和基礎。每個DBMS軟體都是基於某種資料模型的。為了把現實世界中的具體事物或事物之間的聯絡表示成DBMS所支援的資料模型,人們首先必須將現實世界的事物及其之間的聯絡進行抽象,轉換為資訊世界的概念模型;然後將資訊世界的概念模型轉換為機器世界的資料模型。也就是說,首先把現實世界中的客觀物件抽象成一種資訊結構。這種資訊結構並不依賴於具體的計算機系統和DBMS。然後,再把概念模型轉換為某一計算機系統上某一DBMS所支援的資料模型。因此,概念模型是從現實世界到機器世界的一箇中間層次。現實世界的事物反映到人的大腦之中,然後人們開始認識這些事物,經過選擇、命名、分類和組織等抽象工作之後形成概念模型,並進入到資訊世界。

•使用者(user) 關心的是現實世界中的事物、事物的屬性及其相互關係。例如,使用者可能關心他的顧客及其屬性,如顧客地址、銀行帳號等等。使用者也關心自己的定貨帳目,如誰訂的貨、訂的什麼和訂多少等等。

•系統分析員(analyst) 同樣也關心現實世界,但是系統分析員需要分析使用者的資訊需求。作為需求分析的結果,分析員必須以文件的形式對需求進行結構化的描述;這個文件就是資訊模型。

•實體(Entity) 實體是構成資料庫的基本元素。實體是指一個存在的東西以區別這個東西所具有的屬性和這個東西與其它東西的聯絡。實體可以是人,也可以是物;可以是實際物件,也可以是概念;可以是事物本身,也可以是指事物之間的聯絡。

•屬性(Attribute) 一個實體可以由若干個屬性來刻畫。屬性是相對實體而言的,是實體所具有的特性。

•關鍵字(Key) 能唯一地標識實體的屬性的集合稱為關鍵字(或碼)。

•域(Domain) 屬性的取值範圍稱作域。

•實體型(Entity Type) 一類實體所具有的共同特徵或屬性的集合稱為實體型。一般用實體名及其屬性來抽象地刻畫一類實體的實體型。

•實體集(Entity Set) 同型實體的集合叫實體集。例如,學生就是一個實體集。實體集的名即是實體型。對於學生和(學號,姓名,年齡,系,年級)均是實體型,而學生是對實體型(學號,姓名,年齡,系,年級)所起的名稱,兩者是指同一客觀物件。但本科生和研究生可以為相同實體型,而實體集不同。

•聯絡(Relationship) 現實世界的事物之間是有聯絡的。一般存在兩類聯絡:一是實體內部的組成實體的屬性之間的聯絡,二是實體之間的聯絡。在考慮實體內部的聯絡時,是把屬性看作為實體。一般來說,兩個實體之間的聯絡可分為三種:

(1)一對一(1∶1)聯絡 若對於實體集A中的每一個實體,實體集B中至多有唯一的一個實體與之聯絡,反之亦然,則稱實體集A與實體集B具有一對一聯絡,記作1∶1。

(2)一對多(1∶n)聯絡 若對於實體集A中的每個實體,實體集B中有n個實體(n≥0)與之聯絡;反之,對於實體集B中的每一個實體,實體集A中至多隻有一個實體與之聯絡,則稱實體集A與實體集B有一對多聯絡,記為1∶n。相應地有多對一(n∶1)聯絡 多對一聯絡,從本質上說,是一對多聯絡的逆轉。其定義同一對多聯絡類似,不再贅述。

(3)多對多(m∶n)聯絡 若對於實體集A中的每一個實體,實體集B中有n個實體(n≥0)與之聯絡;反之,對於實體集B中的每一個實體,實體集A中也有m個實體(m≥0)與之對應,則稱實體集A與實體集B具有多對多聯絡,記作m∶n。實質上,多對多聯絡是任意一種聯絡。另外,同一實體集內的各個實體間也可以有各種聯絡。概念模型的表示方法最常用的是實體一聯絡方法(Entity-Relationship Approach),簡稱E-R方法。該方法是由在1976年提出的。E-R方法用E-R圖來描述某一組織的概念模型。在這裡僅介紹E-R圖的要點。在E-R圖中:

(1)長方形框表示實體集,框內寫上實體型的名稱。

(2)用橢圓框表示實體的屬性,並用有向邊把實體框及其屬性框連線起來。

(3)用菱形框表示實體間的聯絡,框內寫上聯絡名,用無向邊把菱形框及其有關的實體框連線起來,在旁邊標明聯絡的種類。如果聯絡也具有屬性,則把屬性框和菱形框也用無向邊連線上。

3.三種主要的資料模型

實際DBMS所支援的資料模型主要有三種:

•層次模型(Hierarchical Model)

•網狀模型(Network Model)

•關係模型(Relational Model)其中,關係模型是當前DBMS所支援的資料模型的主流。90年代執行的DBMS幾乎都是基於關係模型的。層次模型和網狀模型統稱為非關係模型。非關係模型的結構可以和圖論中的圖相對應,比較直觀,但在理論上不完備,實現效率較低,故此目前很少用。但是最近,層次模型在研究面向物件的DBMS中已得到重視。在關係模型中,資料在使用者的觀點中(或在使用者檢視中)的邏輯結構是一張二維表(Table)。

•關係(Relation),對應於平常講的一張表。

•元組(Tuple),表中的一行。

•屬性(Attribute),表中的一列稱為一個屬性,給每一列起一個名,稱為屬性名。這一列或這個屬性所有可能取的值的集合稱為這個屬性的值域(Domain),值域中的一個元素叫做這個屬性的值。

•主關鍵字(Primary Key Attribute或Primary Key),是指能唯一標識一個元組的一個或一組屬性。

•分量(Attribute value),是指元組中的一個屬性值。

•關係模式(Relational Schema),是對關係的描述,一般用關係名(屬性名1,屬性名2,…,屬性名n)來表示。同層次模型和網狀模型相比較,關係模型具有下列特點:

(1)概念單一 在關係模型中,無論是實體還是實體之間的聯絡都用關係來表示。在關係模型中,在使用者的觀點中,資料的邏輯結構就是表,也只有這唯一的概念。在非關係模型中,使用者要區分記錄型與記錄型之間的聯絡兩個概念;當環境複雜時,資料結構異常複雜,難以掌握。而關係模型,由於概念單一,可以變複雜為直觀、簡單,易學易用。

(2)規範化 所謂關係規範化是指在關係模型中,每一個關係都要滿足一定的條件要求。這些條件被稱為規範條件。對於關係,一個最基本的'規範條件是,要求關係中的每一個屬性(或分量)均是不可分的資料項;也就是說不允許表中有表,表是不可巢狀的。

(3)在關係模型中,使用者對資料的操作的輸入和輸出都是表,也就是說,使用者通過操作舊錶而得到一張新表。總之,關係模型概念簡單,結構清晰,使用者易學易用,有嚴格的以數學為基礎的關係理論作指導,便於DBMS的實現。基於關係的DBMS簡化了應用程式設計師的工作,便於資料庫應用系統的設計和維護。故此,關係模型自誕生以後就得到了迅速的發展,成為應用最為廣泛的、唯一的資料模型。

  二、資料庫系統的結構

1.資料庫系統的三級模式結構

資料庫管理系統的三級模式結構由外模式、模式和內模式組成。外模式(external schema),或子模式(subschema)或使用者模式(user schema),是指資料庫使用者所看到的資料結構,是使用者看到的資料檢視。模式(schema)或邏輯模式(logic schema),是資料庫中對全體資料的邏輯結構和特性的描述,是所有使用者所見到的資料檢視的總和。外模式是模式的一部分。內模式(internal schema),或儲存模式(storage schema),或物理模式(physical schema),是指資料在資料庫系統內的儲存介質上的表示,即對資料的物理結構和存取方式的描述。模式描述的是資料的全域性的邏輯結構,決定了DBMS的功能。外模式涉及的僅是區域性的邏輯結構,是模式的子集,是對模式的呼叫。資料庫系統的三級模式是對資料進行三個層次抽象的工具。通過三級模式,把對資料的具體組織留給DBMS來完成,使得使用者能在高層次上處理資料的邏輯結構,而不必關心資料的物理結構。為了實現這三個層次這間的聯絡,DBMS在溝通三級模式中提供了兩個映象:外模式-模式映象模式-內模式映象

(1)模式 模式規定了資料庫中全部資料的一個邏輯表示或描述形式。模式既不同於內模式,也不同於外模式。它比內模式抽象,不涉及資料的物理結構和儲存介質。它與具體的應用程式或高階語言無關。

(2)外模式 外模式是個別用戶的資料檢視,即與某一應用有關的資料的邏輯表示。

(3)內模式 內模式是全部資料庫的內部表示或底層描述,是用來定義資料的物理結構和存取方式的。

(4)二級映象 對於同一個模式,可以有任意多個外模式。外模式-模式的映象定義了某個外模式和模式之間的對應關係。這些映象的定義通常包含在各自的外模式中。當模式改變時,外模式-模式的映象要做相應的改變,以保證外模式的不變性。這是資料庫管理員(DBA)的責任。模式-內模式的映象定義了資料邏輯結構和儲存結構之間的對應關係。例如,欄位的內部表示等。當資料庫的儲存結構改變時,模式-內模式的映象也須做相應的修改,以使得模式保持不變性。這仍是DBA的責任。正是由於上述二級映象的功能及其自動實現,使得資料庫系統中的資料具有較高的邏輯獨立性和物理獨立性,從而大大地方便了使用者的使用。

(5)概念模式與模式ANSI研究組於1975年2月提出一個臨時報告。1978年提出一個最終報告,稱之為ANˉSI/SPARC報告,簡稱為SPARC報告。SPARC報告中指出,資料庫管理系統應具有三級模式的結構,即概念模式、外模式和內模式。其中外模式和內模多與上面所講的大致相當。但SPARC報告中的概念模式是指一個組織或部門所對應的現實世界的真實模型,即概念模型。概念模式僅描述實體及其屬性和聯絡,不涉及機器世界的概念。概念模型是資訊世界範疇內的資訊的結構,而模式是機器世界範疇內的概念模型的邏輯表示。概念模型獨立於具體的計算機系統,甚至是和計算機無關的,是一個組織或部門的模型。常用的描述概念模式的方法是E-R方法。模式是依賴於具體的計算機及其DBMS的。模式通過三種具體模型:層次模型、網狀模型和關係模型來加以實現。概念模式必須轉換成具體的資料模型,然後才能在相應的DBMS上實現。概念模型和模式都是描述資訊或資料的整體結構的,然而它們是在不同的抽象層次上加以描述的。概念模型離機器更遠,形式化程度低。從遠離機器的觀點看,概念模型更抽象些,但更接近現實世界。而模式描述使用的是形式化的語言-模式DDL,而概念模型描述使用的是E-R圖和一些自然語言。

2.使用資料庫的計算機系統結構

廣義地講,實際上使用資料庫的計算機系統由下列幾個部分組成的:

(1)硬體部分 包括主機、外部儲存裝置、網路裝置和電源等。

(2)軟體部分 包括作業系統、DBMS、編譯系統和應用開發工具軟體等。

(3)人員 包括資料庫管理員(Data Base Administrator-DBA),系統分析員(System Anaˉlyst)、應用程式設計師(Application Programmer)和使用者(User)。

3.資料庫管理系統

資料庫管理系統DBMS是資料庫系統的核心。DBMS是負責資料庫的建立、使用和維護的軟體。DBMS建立在作業系統之上,實施對資料庫的統一管理和控制。使用者使用的各種資料庫命令以及應用程式的執行,最終都必須通過DBMS。另外,DBMS還承擔著資料庫的安全保護工作,按照DBA所規定的要求,保證資料庫的完整性和安全性。DBMS的主要功能包括以下幾個主要方面:

(1)資料庫的定義功能 DBMS通過提供資料描述語言(也稱資料定義語言)(Data Descripˉtive Language———DDL)來對外模式、模式和內模式加以描述。然後模式翻譯程式把用DDL寫的各種模式的定義原始碼翻譯成相應的內部表示,形成相應的目標形式,分別叫目標外模式、目標模式、目標內模式,這些目標模式是對資料庫的描述,而不是資料本身。(目標)模式只刻畫了資料庫的形式或框架,而不包括資料庫的內容。這些目標模式被儲存在資料字典(或系統目標)之中,作為DBMS存取和管理資料的基本依據。例如,DBMS根據這些模式定義,進行物理結構和邏輯結構的映象,進行邏輯結構和使用者檢視的映象,以匯出使用者要檢索的資料的存取方式。

(2)資料操縱功能 DBMS提供資料操縱語言(Data Manipulation Language———DML)實現對資料庫中資料的一些基本操作,如:檢索、插入、修改、刪除和排序等等。DML有兩類:一類是嵌入主語言的,如嵌入到C或COBOL等高階語言中。這類DML語言本身不能單獨使用,故此稱為宿主型的DML或嵌入式DML。另一類是非嵌入式語言(包括互動式命令語言和結構化語言),它的語法簡單,可以獨立使用,由單獨的解釋或編譯系統來執行,所以一般稱為自主型或自含型的DML。命令語言是行結構語言,單條執行。結構化語言是命令語言的擴充或發展,增加了程式結構描述或過程控制功能,如迴圈、分支等功能。命令語言一般逐條解釋執行。結構化語言可以解釋執行,也可以編譯執行。現在DBMS一般均提供命令語言的互動式環境和結構環境兩種執行方式,供使用者選擇。DBMS控制和執行DML語句(或DML程式),完成對資料庫的操作。對於自主型的結構化的DML,DBMS通常採用解釋執行的方法,但也有編譯執行的方法,而且編譯執行的越來越多。另外,很多系統同時設有解釋和編譯兩種功能,由使用者選其一。對於嵌入型或縮主型DML,DBMS一種提供兩種方法:

①預編譯方法。

②修改和擴充主語言編譯程式(亦稱增強編譯方法)。預編譯方法是,由DBMS提供一個預處理程式,對源程式進行語法掃描,識別出DML語句,並把這些語句轉換成主語言中的特殊呼叫語句。主語言必須和DML有呼叫介面。這樣在連線形成目標時和主語言語句一起形成可執行的目標。

(3)資料庫執行管理 資料庫執行期間的動態管理是DBMS的核心部分,包括併發控制、存取控制(或安全性檢查、完整性約束條件的檢查)、資料庫內部的維護(如索引、資料字典的自動維護等)、緩衝區大小的設定等等。所有的資料庫操作都是在這個控制部分的統一管理下,協同工作,以確保事務處理的正常執行,保證資料庫的正確性、安全性和有效性。

(4)資料庫的建立和維護功能 資料庫的建立和維護包括初始資料的裝入、資料庫的轉儲或後備功能、資料庫恢復功能、資料庫的重組織功能和效能分析等功能,這些功能一般都由各自對應的實用功能子程式來完成。DBMS隨軟體產品和版本不同而有所差異。通常大型機上的DBMS功能最全,小型機上的DBMS功能稍弱點,微機上的DBMS更弱些。但是,目前,由於硬體效能和價格的改進,微機上的DBMS功能越來越全。