เค้าร่างฐานข้อมูลที่แสดงรายละเอียดของฐานข้อมูล หมายถึง

1. ฐานข้อมูลและกรรมวิธีข้อมูล (Database and data process)

รูปแบบการจัดเก็บข้อมูลแต่เดิมแบบแฟ้มข้อมูล ต่อมาได้มีการจัดข้อมูลให้อยู่ในรูปฐานข้อมูล เพื่อลดปัญหาการซ้ำซ้อนของข้อมูล (Data redundancy) และความขัดแย้งกันของข้อมูล อันมีสาเหตุจากการแก้ไขข้อมูล(Modification anomaly) การเพิ่มข้อมูล (Insertion anomaly) และการลบข้อมูล (Deletion anomaly) เป็นต้น ปัญหาเหล่านี้ ทำให้การวิเคราะห์ไม่ถูกต้องและขาดประสิทธิภาพ

รูปแบบฐานข้อมูลแตกต่างรูปแบบแฟ้มข้อมูล โดยฐานข้อมูลเป็นการนำเอาข้อมูลต่างๆ ที่มีความสัมพันธ์กันซึ่งแต่เดิมจัดเก็บอยู่ในแต่ละแฟ้มข้อมูลมาจัดเก็บไว้ในที่เดียวกัน เช่น ข้อมูลอาคาร ข้อมูลแปลงที่ดิน ข้อมูลการใช้ประโยชน์ที่ดิน ข้อมูลราคาประเมินภาษี ซึ่งเป็นข้อมูลด้านการจัดเก็บภาษีในเทศบาล และมีการจัดเก็บข้อมูลไว้ในแต่ละฝ่ายที่รับผิดชอบ เมื่อนำข้อมูลที่จัดเก็บในรูปแบบแฟ้มข้อมูล มาจัดเก็บอยู่ในแหล่งเดียวกันเป็นรูปแบบของฐานข้อมูล คือ ฐานข้อมูลของเทศบาล ส่งผลให้สามารถใช้ข้อมูลร่วมกัน และสามารถแก้ไขปัญหาที่เกิดจากการใช้งานข้อมูลแบบแฟ้มข้อมูลกรณีต่างๆ ได้ ข้อมูลที่จะนำมาจัดเก็บเป็นฐานข้อมูลได้นั้นจะต้องเป็นข้อมูลที่มีความสัมพันธ์กัน และสนับสนุนการดำเนินการอย่างใดอย่างหนึ่งขององค์กร ซึ่งจะเรียกว่า ระบบฐานข้อมูล(Database system)

ภาพการจัดเก็บแบบแฟ้มข้อมูล
ภาพการจัดเก็บข้อมูลแบบฐานข้อมูล

2. การจัดการแฟ้มข้อมูลและองค์ประกอบของฐานข้อมูล

ในการดำเนินการต่างๆ กับแฟ้มข้อมูลนั้น ต้องจำแนกประเภทของแฟ้มข้อมูลก่อน เพื่อกำหนดลักษณะการดำเนินการที่จะกระทำต่อแฟ้มข้อมูลนั้นได้อย่างชัดเจน ซึ่งรูปแบบของแฟ้มข้อมูลในปัจจุบันสามารถจำแนกได้ดังนี้

1) ประเภทแฟ้มข้อมูล

– แฟ้มต้นฉบับ (Master file) เป็นแฟ้มข้อมูลที่จัดเก็บข้อมูลที่มักจะไม่มีการเปลี่ยนแปลงหรือมีสภาพค่อนข้างคงที่ เช่น แฟ้มข้อมูลประวัติบุคคล จะประกอบด้วยข้อมูลต่างๆ เช่น หมายเลขบัตรประจำตัวประชาชนชื่อ-สกุล ที่อยู่ ซึ่งการปรับปรุงแก้ไขข้อมูลในแฟ้มต้นฉบับเพื่อให้ทันสมัยนั้น สามารถทำได้ 3 รูปแบบด้วยกัน คือการเพิ่ม การลบออก และการแก้ไข

– แฟ้มดำเนินการ (Transaction file) เป็นแฟ้มข้อมูลที่จัดเก็บข้อมูลการดำเนินธุรกรรมประจำวันที่มีการเคลื่อนไหวอยู่เสมอ เช่น การเปลี่ยนแปลงของข้อมูลเงินฝากของบุคคลต่างๆ ในแต่ละวัน

– แฟ้มเอกสาร (Document file) เป็นแฟ้มข้อมูลเอกสารหรือแฟ้มข้อมูลรายงานต่างๆ ที่เคยผ่านกระบวนการพิมพ์ด้วยโปรแกรมมาก่อน และทำการจัดเก็บในรูปของไฟล์เอกสารด้วยการสำเนาเก็บไว้ในคอมพิวเตอร์เมื่อต้องการใช้งานก็สามารถเรียกขึ้นมาใช้งานได้อย่างวดเร็ว เพราะไม่ต้องผ่านโปรแกรมเพื่อประมวลผลเป็นรายงานอีก

– แฟ้มเอกสารสำคัญ (Archival file) เป็นแฟ้มข้อมูลที่บรรจุไปด้วยแฟ้มต้นฉบับ และแฟ้มดำเนินการซึ่งประกอบด้วยบันทึกประวัติการลบหรือเคลื่อนย้ายจากสื่ออุปกรณ์แบบออนไลน์ (Online storage) ไปจัดเก็บไว้ในสื่ออุปกรณ์ที่เป็นแบบออฟไลน์ (Offline storage) แฟ้มเอกสารสำคัญเป็นแฟ้มข้อมูลที่อาจจำเป็นต้องจัดเก็บไว้ตามระเบียบหรือข้อกำหนดต่างๆ ของหน่วยงานเพื่อใช้ในการตรวจสอบทั้งในปัจจุบันและอนาคต

– แฟ้มสำหรับค้นหา (Table look-up file) เป็นแฟ้มข้อมูลหรือตารางที่ใช้สำหรับการอ้างอิง เพื่อใช้ร่วมงานกันโดยข้อมูลต่างๆ ที่จัดเก็บลงในแฟ้มข้อมูลนี้ค่อนข้างคงที่หรือมักไม่ค่อยเปลี่ยนแปลงใดๆ เช่น ตารางรหัสไปรษณีย์ ตารางรหัสจังหวัด เป็นต้น

– แฟ้มตรวจสอบ (Audit file) เป็นแฟ้มข้อมูลพิเศษชนิดหนึ่งที่จัดเก็บบันทึกที่ถูกปรับปรุงให้ทันสมัยลงในแฟ้มข้อมูลต่างๆ โดยเฉพาะอย่างยิ่ง ในแฟ้มต้นฉบับ และแฟ้มดำเนินการ ซึ่งจะใช้ร่วมกันกับแฟ้มเอกสารสำคัญในการกู้คืนข้อมูลที่สูญหาย แฟ้มข้อมูลประเภทนี้มักจะถูกกำหนดไว้ในระบบฐานข้อมูลเพื่อให้สามารถกู้คืนระบบในกรณีที่ข้อมูลเกิดความเสียหายในระหว่างการประมวลผล

– ในการจัดการแฟ้มข้อมูลต่างๆ ให้อยู่ในรูปแบบของฐานข้อมูลนั้นจะต้องมีการจัดเตรียมองค์ประกอบด้านต่างๆ เพื่อที่จะให้ฐานข้อมูลที่ทำการสร้างขึ้นมานั้นสามารถตอบสนองต่อความต้องการหรือสามารถดำเนินการได้ตามวัตถุประสงค์ของหน่วยงานได้อย่างมีประสิทธิภาพ ตลอดจนสามารถดูแลควบคุมการใช้งานแฟ้มข้อมูลประเภทต่างๆ ให้เป็นไปตามความเหมาะสมและนโยบายในการใช้ข้อมูลของหน่วยงานอย่างเคร่งครัด

2) องค์ประกอบของฐานข้อมูล จากที่ทราบแล้วว่า ฐานข้อมูลเป็นวิธีการที่จะเก็บข้อมูลที่สัมพันธ์กันไว้ในแหล่งเดียวกัน และรวบรวมข้อมูลที่ไม่ซ้ำซ้อนและสามารถใช้ข้อมูลร่วมกันได้อย่างเป็นระบบ เพื่อให้สะดวกต่อการเรียกใช้ สามารถแก้ไขได้ง่าย สำหรับผู้ใช้จำนวนมาก และสามารถป้องกันไม่ให้ผู้ไม่มีสิทธิ์เข้าถึงข้อมูลได้ ซึ่งในการจัดทำฐานข้อมูลเพื่อใช้ภายในองค์กรหรือหน่วยงานใดๆ ก็ตามจะต้องมีการจัดเตรียมองค์ประกอบต่างๆ เพื่อที่จะให้ฐานข้อมูลที่จัดทำขึ้นให้เป็นระบบฐานข้อมูลที่สามารถใช้ประโยชน์ได้อย่างมีประสิทธิภาพ โดยสามารถจำแนกองค์ประกอบที่สำคัญของระบบฐานข้อมูลที่สำคัญได้ดังนี้

– ข้อมูล ข้อมูลแต่ละส่วนจะต้องสามารถนำมาใช้ประโยชน์ประกอบกันได้ (Data integrated)ซึ่งข้อมูลที่จะนำมาใช้ในระบบฐานข้อมูลได้นั้นจะต้องมีคุณสมบัติที่พึงประสงค์ ได้แก่

  • มีความถูกต้อง และอยู่บนพื้นฐานของความเป็นจริง เช่น ในกรณีที่มีการจัดทำข้อมูลเกี่ยวกับการจัดเก็บภาษีโรงเรือนในพื้นที่ จะปรากฏข้อมูลของโรงเรือนชำระภาษีแล้วโดยกำหนดเป็น Y กับโรงเรือนที่ยังไม่ได้ชำระภาษีโดยกำหนดเป็น N เป็นต้น
  • ข้อมูลจะต้องไม่มีความซ้ำซ้อนกัน เช่น ต้องไม่มีการเก็บข้อมูลชุดเดียวกันอยู่ใน 2 แฟ้มข้อมูลหรือมากกว่า ซึ่งจะก่อให้เกิดความขัดแย้งของข้อมูลตามมาในภายหลัง
  • ข้อมูลในฐานข้อมูลจะต้องมีการใช้งานร่วมกัน (Data sharing) จากผู้ใช้หลายๆ คนได้

– คอมพิวเตอร์ฮาร์ดแวร์ (Computer hardware) เป็นอุปกรณ์ที่มีส่วนเกี่ยวข้องกับระบบฐานข้อมูลโดยสามารถจำแนกได้ 3 ประเภท ได้แก่

  • หน่วยประมวลผลและหน่วยความจำหลัก ทำหน้าที่ในการนำข้อมูลจากฐานข้อมูลขึ้นมาประมวลผลตามคำสั่งที่กำหนด ดังนั้นสิ่งที่จำเป็นต้องคำนึงถึงในส่วนนี้คือ ความเร็วในการประมวลผล และขนาดของหน่วยความจำหลักของเครื่องคอมพิวเตอร์ที่นำมาใช้ในการประมวลผลร่วมกับฐานข้อมูล
  • หน่วยความจำสำรอง ทำหน้าที่ในการจัดเก็บข้อมูลของฐานข้อมูล ดังนั้นสิ่งที่ต้องคำนึงถึงในอุปกรณ์ส่วนนี้จึงได้แก่ ปริมาณความจุของหน่วยความจำสำรองที่นำมาใช้ในการบันทึกข้อมูลของฐานข้อมูลนั้น
  • อุปกรณ์การเชื่อมต่อเครือข่าย ทำหน้าที่ในการส่งผ่านข้อมูลระหว่างเครื่องที่ทำงานอยู่ภายใต้ระบบฐานข้อมูลเดียวกัน ดังนั้นสิ่งจำเป็นที่จะต้องคำนึงถึงสำหรับอุปกรณ์ส่วนนี้คือ อัตราความเร็วในการส่งผ่านข้อมูลระหว่างเครื่องคอมพิวเตอร์

– คอมพิวเตอร์ซอฟต์แวร์ (Computer software) ซอฟต์แวร์ที่มีบทบาทสำคัญในระบบฐานข้อมูลซึ่งทำหน้าที่ในการจัดการระบบฐานข้อมูล ได้แก่ DBMS (Database Management System) มีหน้าที่ในการจัดการละควบคุมความถูกต้อง ความซ้ำซ้อน และความสัมพันธ์ระหว่างข้อมูลต่างๆ ภายในฐานข้อมูล ส่งผลให้ผู้ใช้สามารถที่จะเรียกใช้ข้อมูลจากฐานข้อมูลได้โดยไม่จำเป็นที่จะต้องทราบถึงโครงสร้างทางกายภาพของข้อมูล เนื่องจากในซอฟต์แวร์ DBMS จะมีส่วนของภาษาสำหรับการสืบค้นข้อมูล (Query language) ซึ่งเป็นภาษาที่ประกอบด้วยคำสั่งต่างๆ ที่ใช้ในการจัดการ และเรียกใช้ข้อมูลจากฐานข้อมูล ซึ่งสามารถนำไปใช้ร่วมกับภาษาคอมพิวเตอร์อื่นๆ เพื่อพัฒนาเป็นโปรแกรมที่ใช้สำหรับเรียกใช้ข้อมูลจากฐานข้อมูลมาประมวลผลได้

– ผู้ใช้ระบบฐานข้อมูล (User) ผู้ที่เรียกใช้ข้อมูลจากระบบฐานข้อมูลมาใช้งาน สามารถแบ่งออกเป็นระดับต่างๆ ได้ดังนี้

  • นักเขียนโปรแกรมประยุกต์ (Application programmer) ได้แก่ ผู้ที่ทำหน้าที่พัฒนาโปรแกรมเพื่อเรียกใช้ข้อมูลจากระบบฐานข้อมูลมาประมวลผล โดยโปรแกรมที่พัฒนาขึ้นส่วนใหญ่ มักจะใช้ร่วมกับคำสั่งประเภทData Manipulation Language (DML) ของภาษาสำหรับการสืบค้นข้อมูล
  • ผู้ใช้งานทั่วไป (End user) แบ่งออกเป็น 2 ระดับ คือ

* Naive user ได้แก่ ผู้ใช้ที่เรียกใช้ข้อมูลจากฐานข้อมูลโดยอาศัยโปรแกรมที่พัฒนาขึ้น

* Sophisticated user ได้แก่ ผู้ที่เรียกใช้ข้อมูลจากฐานข้อมูลด้วยประโยคคำสั่งของภาษาสำหรับการสืบค้นข้อมูล ซึ่งซอฟต์แวร์ด้านฐานข้อมูลโดยทั่วไปจะอนุญาตให้ผู้ใช้งานสามารถใช้งานประโยคคำสั่งของภาษาสำหรับการสืบค้นข้อมูลเพื่อเรียกใช้ข้อมูลจากฐานข้อมูลได้โดยตรง

  • ผู้กำกับดูแลฐานข้อมูล (Database Administrator : DBA) ได้แก่ ผู้บริหารที่ทำหน้าที่ควบคุมและตัดสินใจในการกำหนดโครงสร้างของฐานข้อมูล ชนิดของข้อมูล วิธีการจัดเก็บข้อมูล รูปแบบในการเรียกใช้ข้อมูลความปลอดภัยของข้อมูล และกฎระเบียบที่ใช้ในการควบคุมความถูกต้องของข้อมูลภายในฐานข้อมูล โดยอาศัยคำสั่งประเภท Data Definition Language (DDL) ซึ่งเป็นอีกส่วนหนึ่งของประโยคคำสั่งของภาษาสำหรับการสืบค้นข้อมูล

3. สถาปัตยกรรมระบบฐานข้อมูล สถาปัตยกรรมของระบบฐานข้อมูล

เป็นการอธิบายถึงรูปแบบและโครงสร้างของข้อมูลภายในระบบฐานข้อมูลโดยทั่วไปในระดับแนวความคิด โดยไม่ขึ้นอยู่กับโครงสร้างของระบบฐานข้อมูลนั้นๆ สำหรับสถาปัตยกรรมของระบบฐานข้อมูลที่นิยมใช้ ได้แก่ ANSI/ SPARC (American National Standards Institute/System Requirements Committee) กำหนดขึ้นโดย Study on database management system ซึ่งได้แบ่งสถาปัตยกรรมออกเป็น 3 ระดับ ดังนี้

1) สถาปัตยกรรมในระดับภายนอก (External level) เป็นการกำหนดรูปแบบการใช้งานจากภายนอกซึ่งสามารถเปลี่ยนแปลงได้ตามมุมมองของผู้ใช้งานฐานข้อมูล ซึ่งในส่วนนี้จะไม่ใช่รูปร่างและส่วนโครงสร้างของข้อมูลที่แท้จริง เพียงแต่จะถูกกำหนดให้ผู้ใช้สามารถใช้ข้อมูลในมุมมองต่างๆ ได้โดยการอาศัยภาษาคอมพิวเตอร์ในการเรียกใช้ข้อมูลนั้นๆ ขึ้นมาแสดงผลระเบียน (Record) ที่อยู่ในสถาปัตยกรรมนี้เรียกว่า ระเบียนภายนอก (External record) เนื่องจากไม่ใช่ระเบียนที่แท้จริงที่เก็บอยู่ในฐานข้อมูล แต่จะเป็นระเบียนที่มีรูปแบบตามที่ผู้ใช้แต่ละคนกำหนด เช่น ผู้ใช้ที่ใช้คำสั่ง Data Manipulation Language (DML) เพื่อเรียกใช้ข้อมูลสามารถกำหนดลำดับของเขตข้อมูล (Field) ในการแสดงผลได้ตามที่ตนต้องการ โดยไม่จำเป็นต้องเป็นไปตามลำดับจริงในฐานข้อมูล เป็นต้น และจากระเบียนในระดับนี้ เป็นระเบียนภายนอก จึงส่งผลให้โครงสร้างของข้อมูลในระดับภายนอก (External schema) นี้ไม่ใช่โครงสร้างของข้อมูลที่แท้จริงด้วยเช่นเดียวกัน เนื่องจากโครงสร้างที่กำหนดไว้เมื่อตอนสร้างฐานข้อมูลด้วยกลุ่มคำสั่ง DDL จะไม่ใช่โครงสร้างของข้อมูลที่แท้จริงที่จัดเก็บอยู่ในฐานข้อมูล

2) สถาปัตยกรรมในระดับแนวคิด (Conceptual level) เป็นระดับสถาปัตยกรรมทางด้านฐานข้อมูลที่กล่าวถึงโครงสร้างฐานข้อมูลในระดับแนวคิด ซึ่งเป็นภาพของโครงสร้างข้อมูลที่ใช้แทนโครงสร้างทางกายภาพของข้อมูลที่แท้จริงในฐานข้อมูล เพื่อให้ง่ายต่อการอธิบายถึงโครงสร้างของข้อมูลต่างๆ ที่เก็บอยู่ในฐานข้อมูลนั้นๆ ดังนั้นภาพของระเบียนที่เห็นในสถาปัตยกรรมระดับนี้ จะเรียกว่า ระเบียนระดับแนวคิด (Conceptual record) ซึ่งไม่จำเป็นที่จะต้องมีโครงสร้างเช่นเดียวกันกับโครงสร้างของระเบียนภายนอก และโครงสร้างทางกายภาพของระเบียนที่เก็บอยู่จริง ในการนำเสนอโครงสร้างของข้อมูลระเบียนระดับแนวคิดที่เรียกว่าโครงสร้างระดับแนวคิด (Conceptual schema) จะต้องใช้ภาษาสำหรับการนำเสนอที่มีคุณสมบัติของ Data independence กล่าวคือ ต้องไม่มีการนำเสนอที่ขึ้นอยู่กับโครงสร้างทางกายภาพในการจัดลำดับที่ของเขตข้อมูล โครงสร้างของดัชนี (Index) หรืออื่นๆ แต่ต้องมุ่งเน้นที่จะนำเสนอเฉพาะโครงสร้างข้อมูลโดยทั่วไปของข้อมูลในฐานข้อมูล และถ้าโครงสร้างระดับแนวคิด มีคุณสมบัติแบบ Data independence แล้ว จะส่งผลให้โครงสร้างภายนอก มีคุณสมบัติ Data independence ตามไปด้วย เนื่องจากโครงสร้างภายนอกกำหนดขึ้นจากโครงสร้างระดับแนวคิด

3) สถาปัตยกรรมระดับภายใน (Internal level) เป็นระดับสถาปัตยกรรมที่กล่าวถึงโครงสร้างข้อมูลของระเบียนในระดับที่ใกล้เคียงกับโครงสร้างข้อมูลจริงของระเบียนที่จัดเก็บไว้ในหน่วยความจำสำรองมากที่สุด ระเบียนของสถาปัตยกรรมระดับนี้จะเรียกว่า ระเบียนภายใน (Internal record) ส่วนโครงสร้างข้อมูลของระเบียนของสถาปัตยกรรมระดับนี้จะเรียกว่า โครงสร้างภายใน (Internal schema) ซึ่งโครงสร้างข้อมูลในระดับนี้ยังอยู่ในระดับที่เหนือกว่าโครงสร้างข้อมูลในระดับกายภาพ กล่าวคือ โครงสร้างระเบียนภายใน จะเป็นเพียงการนำเสนอโครงสร้างข้อมูลที่กล่าวถึงเนื้อที่ที่ใช้ในการจัดเก็บ ลำดับที่ ประเภทข้อมูล ดัชนีที่ใช้ และอื่นๆ ซึ่งจะใช้เป็นข้อมูลที่นำไปใช้กำหนดโครงสร้างทางกายภาพที่แท้จริง ที่ใช้ในการจัดเก็บข้อมูลในหน่วยความจำสำรอง

ภาพแสดงสถาปัตยกรรมฐานข้อมูล
ที่มา: //ksi.cpsc.ucalgary.ca/KAW/KAW96/laresgoiti/k02.gif

4. แบบจำลองข้อมูล (Data model) จากสถาปัตยกรรมของฐานข้อมูลในระดับต่างๆ ดังที่ได้กล่าวมาแล้ว เป็นการกำหนดระดับการจัดทำฐานข้อมูลในระดับต่างๆ ซึ่งสิ่งที่จะสามารถถ่ายทอดรูปแบบของสถาปัตยกรรมให้เป็นรูปธรรมมากขึ้นก็คือ การจัดทำแบบจำลองข้อมูล ซึ่งเป็นสิ่งที่สามารถอธิบายถึงรายละเอียดต่างๆของการออกแบบฐานข้อมูลสำหรับการปฏิบัติงานจริง รวมทั้งสามารถอธิบายถึงโครงสร้างข้อมูลแบบต่างๆ ได้อย่างชัดเจน แบบจำลองของข้อมูลเป็นแบบจำลองที่ใช้ในการอธิบายถึงโครงสร้าง และความสัมพันธ์ระหว่างข้อมูลภายในฐานข้อมูลจากรูปแบบที่เป็นแนวคิดซึ่งยากแก่การทำความเข้าใจให้อยู่ในรูปแบบที่สามารถเข้าใจและจับต้องได้ง่ายขึ้นสามารถจำแนกประเภทของแบบจำลองข้อมูลได้ 2 ประเภท ดังนี้

1) แบบจำลองแนวคิด (Conceptual model) เป็นแบบจำลองที่นำไปใช้ในการออกแบบฐานข้อมูลเพื่อต้องการอธิบายให้เห็นว่า ภายในฐานข้อมูลจะประกอบด้วยข้อมูลอะไรบ้าง แต่ละข้อมูลมีความสัมพันธ์กันอย่างไร ดังนั้นแบบจำลองในกลุ่มนี้จึงประกอบสัญลักษณ์ที่ใช้แทนตัวข้อมูล คุณสมบัติข้อมูลและความสัมพันธ์ต่างๆ สำหรับตัวอย่างฐานข้อมูลประเภทนี้ได้แก่ Entity-Relationship model (E-R model) และ Object-oriented model

2) แบบจำลองนำไปปฏิบัติ (Implementation model) เป็นแบบจำลองที่ถูกนำมาใช้อธิบายถึงโครงสร้างของฐานข้อมูลแต่ละประเภทที่ถูกคิดค้นขึ้น ได้แก่ แบบจำลองลำดับขั้น (Hierarchical model) แบบจำลองฐานข้อมูลโครงข่าย (Network database model) และแบบจำลองฐานข้อมูลเชิงสัมพันธ์ (Relational database model)

5. ประเภทความสัมพันธ์ของข้อมูล ในการที่จะทำความเข้าใจเกี่ยวกับแบบจำลองข้อมูลประเภทต่างๆ จำเป็นต้องมีความเข้าใจเกี่ยวกับความสัมพันธ์ในฐานข้อมูลเสียก่อน เนื่องจากความสัมพันธ์ระหว่างข้อมูลต่างๆ ที่จัดเก็บอยู่ในฐานข้อมูล จัดเป็นส่วนที่สำคัญที่มีผลต่อโครงสร้างฐานข้อมูล และใช้เป็นส่วนที่ใช้แบ่งฐานข้อมูลออกเป็นฐานข้อมูลประเภทต่างๆ

1) ความสัมพันธ์แบบหนึ่งต่อหนึ่ง (One-to-One) เป็นความสัมพันธ์ที่มีลักษณะไม่ซับซ้อน กล่าวคือ 1 ระเบียน ในตารางหนึ่งจะมีความสัมพันธ์กับอีกระเบียน 1 ในอีกตารางหนึ่งเท่านั้น ไม่สามารถมีเกิน 1 ได้ เช่น ตารางเลขที่เอกสารสิทธิที่ดิน กับตารางขนาดแปลงที่ดิน

ภาพแสดงความสัมพันธ์แบบหนึ่งต่อหนึ่ง

ในความเป็นจริงเราสามารถที่จะจัดทำให้ตารางดังภาพ เป็นตารางเดียวกันได้ แต่ในบางกรณีอาจจะมีความจำเป็นต้องจัดทำข้อมูลแยกออกจากกันโดยอาศัยความสัมพันธ์แบบหนึ่งต่อหนึ่งเข้ามาเป็นตัวเชื่อมความสัมพันธ์ เนื่องมาจากสาเหตุบางประการ เช่น ปริมาณของข้อมูล ความเร็วในการเข้าถึงข้อมูล เป็นต้น

2) ความสัมพันธ์แบบหนึ่งต่อกลุ่ม (One-to-Many) เป็นลักษณะความสัมพันธ์ที่ระเบียนในตารางหนึ่งมีความสัมพันธ์กับระเบียนในอีกตารางหนึ่งตั้งแต่ 2 ระเบียนขึ้นไป ยกตัวอย่างเช่น บุคคลหนึ่งคนสามารถครอบครองที่ดินได้หลายแปลง ซึ่งอาจจำแนกตารางออกเป็นตารางหมายเลขเอกสารสิทธิและตารางรายชื่อผู้ครอบครองเอกสารสิทธิ

ภาพแสดงความสัมพันธ์แบบหนึ่งต่อกลุ่ม

3) ความสัมพันธ์แบบกลุ่มต่อกลุ่ม (Many-to-Many) เป็นความสัมพันธ์ที่มีลักษณะคือ ระเบียนในตารางหนึ่งมีความสัมพันธ์กับระเบียนในอีกตารางหนึ่งตั้งแต่ 2 ระเบียนขึ้นไป และในขณะเดียวกันระเบียนในตารางที่สองก็จะมีความสัมพันธ์กับระเบียนในตารางที่หนึ่งตั้งแต่ 2 ระเบียนขึ้นไปเช่นเดียวกัน

ภาพแสดงความสัมพันธ์แบบกลุ่มต่อกลุ่ม

จากตัวอย่างภาพจะเห็นได้ว่าเอกสารสิทธิหมายเลขที่ 456 และ 458 มีความสัมพันธ์แบบกลุ่มต่อกลุ่มกับตารางรายชื่อผู้ครอบครองเอกสารสิทธิซึ่งได้แก่ นายศิลา ดวงทิพย์ และนายองอาจ ศรีเพ็ชร ซึ่งในขณะเดียวกันในตารางรายชื่อผู้ครอบครองเอกสารสิทธิ นายองอาจ ศรีเพ็ชร และนายอนุกูล ศรีสะอาด ก็มีความสัมพันธ์กับตารางข้อมูลเอกสารสิทธิในแปลงที่ดิน 456 และ 458

6. แบบจำลองฐานข้อมูล (Database model)

1) แบบจำลองฐานข้อมูลแบบลำดับขั้น (Hierarchical database model) เป็นแบบจำลองฐานข้อมูลที่ถูกคิดค้นโดยบริษัท North American Rockwell ตามแนวคิดการจัดเก็บข้อมูลของโปรแกรม Generalized Update Access Method (GUAM) ที่มีการนำข้อมูลในแต่ละส่วน (Part) มารวมกันเป็นกลุ่ม (Component) และทำการรวมข้อมูลกลุ่มแต่ละกลุ่มทั้งหมดเป็นกลุ่มใหญ่ (Final component) นำมาใช้ในการลดความซ้ำซ้อนของข้อมูล (Data redundancy) โดยมีโครงสร้างอยู่ในรูปแบบของต้นไม้ (Tree structure) ในลักษณะ Upside-Down tree ที่จัดเก็บข้อมูล ในรูปของเซกเมนต์ (Segment) ซึ่งเทียบเท่ากับระเบียนในระบบแฟ้มข้อมูล

ภาพแสดงแบบจำลองฐานข้อมูลแบบลำดับขั้น

จากภาพจะพบว่า “จังหวัด” ทำหน้าที่เป็น Root segment โดยมี “อำเภอ 1” “อำเภอ 2” และ “อำเภอ 3” เป็นข้อมูลภายในของจังหวัดซึ่งอยู่ในระดับที่เรียกว่า Level 1 segment และจากระดับ Level 1 segment สามารถที่จะมีข้อมูลอื่นๆ ประกอบภายในได้อีกโดยจะถูกกำหนดให้เป็นระดับต่างๆ ต่อไป การใช้แบบจำลองฐานข้อมูลประเภทนี้ในทางปฏิบัติอาจจะพบทั้งข้อดีและข้อเสีย ซึ่งสามารถจำแนกได้ดังต่อไปนี้

ข้อดีของแบบจำลองฐานข้อมูลแบบลำดับขั้น

– สามารถกำหนดกฎที่ใช้ควบคุมความถูกต้องให้กับข้อมูล (Data integrity) ภายในฐานข้อมูลได้ง่ายเนื่องจากกฎเกณฑ์ที่กำหนดให้แก่ Root segment สามารถที่จะถ่ายทอดไปยัง Level segment ในระดับต่างๆ ได้โดยตรง

– มีโครงสร้างที่เหมาะต่อข้อมูลที่มีความสัมพันธ์แบบหนึ่งต่อกลุ่ม

– สามารถทำความเข้าใจเกี่ยวกับความสัมพันธ์ข้อมูลภายในได้ง่าย

– การออกแบบฐานข้อมูลไม่มีความซับซ้อน

ข้อเสียของแบบจำลองฐานข้อมูลแบบลำดับขั้น

– ผู้ใช้ฐานข้อมูลจะต้องทราบถึงโครงสร้างทางกายภาพของข้อมูลที่จัดเก็บอยู่ในฐานข้อมูลจึงจะสามารถเรียกใช้ข้อมูลจากฐานข้อมูลได้

– โครงสร้างของฐานข้อมูลไม่สามารถรองรับข้อมูลที่มีความสัมพันธ์ในแบบกลุ่มต่อกลุ่มได้ อันเนื่องมาจากลักษณะของแบบจำลองประเภทนี้ที่มีการแบ่งข้อมูลออกเป็นระดับ (Level) และมีการกระจายออกเป็นระดับต่างๆ ภายในได้อีก ทำให้ความสัมพันธ์ที่เกิดขึ้นไม่สามารถสร้างความสัมพันธ์ข้าม Root ของตัวเองได้

– การเปลี่ยนแปลงโครงสร้างกระทำได้ยาก เนื่องจากโครงสร้างลักษณะนี้มีความยืดหยุ่นค่อนข้างน้อยเช่น การลบ หรือเพิ่มจำนวนข้อมูลเข้าไป ไม่ว่าจะในระดับใดก็จะส่งผลกระทบต่อข้อมูลในส่วนอื่นๆ ตามไปด้วย

– การพัฒนาโปรแกรมเพื่อเรียกใช้ข้อมูลจากฐานข้อมูลกระทำได้ยาก เนื่องจากต้องทราบถึงโครงสร้างข้อมูลทั้งหมดเสียก่อน

– ไม่มีการกำหนดรูปแบบที่เป็นมาตรฐานให้กับโครงสร้างฐานข้อมูล จึงส่งผลให้การโอนถ่ายข้อมูลระหว่างหน่วยงานหรือระหว่างซอฟต์แวร์ที่ต่างกันกระทำได้ยาก

2) แบบจำลองฐานข้อมูลแบบเครือข่าย (Network database model) เป็นแบบจำลองของฐานข้อมูลที่อธิบายถึงฐานข้อมูล ที่มีโครงสร้างของข้อมูลที่จำแนกตามความสัมพันธ์ของข้อมูล ที่ได้รับการพัฒนามาจากฐานข้อมูลแบบลำดับขั้น โดยมีจุดมุ่งหมายเพื่อกำหนดให้เป็นรูปแบบของโครงสร้างข้อมูลที่เป็นมาตรฐาน รวมทั้งมุ่งหวังให้เป็นฐานข้อมูลที่สามารถรองรับข้อมูลที่มีความสัมพันธ์แบบกลุ่มต่อกลุ่มในปี ค.ศ. 1970 กลุ่มผู้พัฒนาภาษา COBOL ที่มีชื่อว่า Conference On Data System Language (CODASYL) ได้จัดตั้งทีมที่ชื่อว่า Database Task Group (DBTG) ขึ้นเพื่อร่วมกันกำหนดมาตรฐานเพื่อใช้ในการสร้าง และจัดการกับข้อมูลภายในฐานข้อมูล โดยกำหนดมาตรฐานหลักๆ ไว้ 3 ประการดังนี้

– มาตรฐานการกำหนดโครงสร้างให้ฐานข้อมูล ซึ่งต่อมาได้กลายเป็นมาตรฐานของกลุ่มคำสั่ง DDL

– มาตรฐานในการเรียกใช้ข้อมูลจากฐานข้อมูลร่วมกับคำสั่งของภาษาคอมพิวเตอร์ที่ใช้ในการพัฒนาโปรแกรม

– มาตรฐานการจัดการข้อมูลภายในฐานข้อมูล ซึ่งต่อมาได้กลายเป็นมาตรฐานของกลุ่มคำสั่ง DML

ภาพแสดงแบบจำลองฐานข้อมูลแบบเครือข่าย

ข้อดีของแบบจำลองฐานข้อมูลแบบเครือข่าย

– สามารถรองรับข้อมูลที่มีความสัมพันธ์แบบกลุ่มต่อกลุ่มได้

– ความซ้ำซ้อนของข้อมูลน้อยกว่าแบบจำลองฐานข้อมูลแบบลำดับขั้น

– สามารถเชื่อมโยงความสัมพันธ์ข้อมูลแบบไปกลับได้

– มีความยืดหยุ่นในการเข้าถึงข้อมูลดีกว่าแบบจำลองฐานข้อมูลแบบลำดับขั้น

ข้อเสียของแบบจำลองฐานข้อมูลแบบเครือข่าย

– เนื่องจากสามารถเข้าถึงข้อมูลได้โดยตรงทำให้การรักษาความปลอดภัยให้แก่ข้อมูลกระทำได้ยาก

– การออกแบบฐานข้อมูลกระทำได้ยาก เนื่องจากต้องกำหนดความสัมพันธ์ของข้อมูลให้ครอบคลุมทุกข้อมูล

– การเปลี่ยนแปลงโครงสร้างของข้อมูลกระทำได้ยาก เนื่องจากต้องคำนึงถึงความสัมพันธ์ของข้อมูลแต่ละประเภทให้ครบถ้วน

3) แบบจำลองฐานข้อมูลเชิงสัมพันธ์ (Relational database model) ฐานข้อมูลประเภทนี้จะมีโครงสร้างที่จัดออกเป็นหน่วยย่อยต่างๆ ในรูปแบบของตารางโดยจะประกอบไปด้วยชุดของแถว (Row) และชุดสดมภ์ (Column) ข้อมูลที่จัดเก็บอยู่ในแต่ละตารางจะเป็นเอกเทศ แต่สามารถนำมาสร้างความสัมพันธ์กันได้โดยอาศัยคีย์ (Key) เป็นตัวกำหนดความสัมพันธ์ ซึ่งประกอบไปด้วยคีย์ต่างๆ ดังนี้

– คีย์หลัก (Primary key) คือ คอลัมน์ที่มีค่าภายในระเบียนแต่ละระเบียนไม่ซ้ำกันในตารางใดๆ ซึ่งสามารถใช้คอลัมน์ที่เป็นคีย์หลักนี้เป็นตัวแทนของตารางแต่ละตารางในการเชื่อมโยงความสัมพันธ์กันระหว่างตารางได้

– คีย์คู่แข่ง (Candidate key) เป็นข้อมูลในคอลัมน์ใดหรือหลายคอลัมน์ที่เมื่อนำมารวมกันแล้วจะมีคุณสมบัติเป็นคีย์หลัก แต่ไม่ใช้ในการจัดทำเป็นคีย์หลัก เช่น คอลัมน์รหัสจังหวัดเป็นคีย์หลัก ส่วนคอลัมน์รายชื่อจังหวัดก็มีข้อมูลที่ไม่ซ้ำกันเหมือนกับรหัสจังหวัดแต่ไม่ได้นำมาใช้เป็นคีย์หลักเพื่อใช้สร้างความสัมพันธ์ระหว่างตารางจึงเป็นคีย์คู่แข่งแทน

– คีย์นอก (Foreign key) ประกอบด้วยข้อมูลลักษณะประจำหรือกลุ่มของข้อมูลลักษณะประจำในตารางหนึ่งที่มีคุณสมบัติเป็นคีย์หลัก และไปปรากฏในอีกความสัมพันธ์หนึ่ง ซึ่งคีย์นอกจัดเป็นคีย์ที่สำคัญมากในฐานข้อมูลเชิงสัมพันธ์เพราะว่าเป็นตัวที่ใช้ในการเชื่อมความสัมพันธ์ระหว่างตาราง

– คีย์สำรอง (Secondary key) ก็คือคีย์คู่แข่งที่ไม่ได้ถูกเลือกให้เป็นคีย์หลัก กล่าวคือ คีย์สำรองนี้เมื่อนำไปใช้ในการค้นหาข้อมูลจากความสัมพันธ์จะได้มากกว่าหนึ่งระเบียน เพราะว่าคีย์สำรองนั้นไม่มีความเป็นเอกลักษณ์โดยสามารถเรียกคีย์สำรองนี้อีกชื่อหนึ่งว่า Alternate key

ภาพแสดงแบบจำลองฐานข้อมูลเชิงสัมพันธ์

7. ระบบการจัดการฐานข้อมูล (Database Management System : DBMS) คือโปรแกรมที่ทำหน้าที่เป็นตัวกลางในการติดต่อระหว่างผู้ใช้กับฐานข้อมูล เพื่อจัดการ ควบคุมความถูกต้อง ความซ้ำซ้อน และความสัมพันธ์ระหว่างข้อมูลต่างๆ ภายในฐานข้อมูล ในการติดต่อกับฐานข้อมูลทั้งที่ใช้คำสั่งในกลุ่มของ DML หรือ DDL แม้กระทั่งโดยใช้โปรแกรมต่างๆ ทุกคำสั่งที่ใช้กระทำกับตัวข้อมูลจะถูกโปรแกรม DBMS นำมาแปลเป็นการกระทำ (Operation) เพื่อนำไปกระทำกับข้อมูลที่ถูกเรียกใช้ภายในฐานข้อมูลก่อนเสมอ ซึ่งภายใน DBMS ก็จะมีส่วนการทำงานด้านต่างๆ ซึ่งเป็นองค์ประกอบภายในดังต่อไปนี้

1) Database manager เป็นส่วนที่ทำหน้าที่กำหนดการกระทำต่างๆ ให้กับ File manager ซึ่งทำหน้าที่ในการบริหารและจัดการกับข้อมูลที่จัดเก็บอยู่ในฐานข้อมูลในระดับกายภาพ เพื่อไปกระทำกับข้อมูลที่อยู่ในฐานข้อมูล

2) Query processor เป็นส่วนที่ทำหน้าที่ในการแปลงประโยคคำสั่งในการสืบค้นข้อมูลในฐานข้อมูลให้อยู่ในรูปแบบที่ Database manager สามารถเข้าใจและนำไปประมวลผลได้

3) Structure Query Language (SQL) เป็นภาษาที่รูปแบบเป็นภาษาอังกฤษ ง่ายต่อการเรียนรู้และการเขียนโปรแกรม ซึ่งเป็นภาษาที่มีอยู่ใน DBMS หลายตัว มีความสามารถใช้นิยามโครงสร้างตารางภายในฐานข้อมูลการจัดการข้อมูล รวมไปถึงการควบคุมสิทธิการใช้งานฐานข้อมูล SQL จะประกอบด้วยภาษา 3 รูปแบบด้วยกัน แต่ละแบบก็จะมีหน้าที่เฉพาะแตกต่างกันไป

– DDL เป็นภาษาที่ใช้นิยามโครงสร้างของฐานข้อมูล เพื่อทำการสร้าง เปลี่ยนแปลง หรือยกเลิกโครงสร้างของฐานข้อมูลตามที่ได้ออกแบบไว้ ซึ่งโครงสร้างของฐานข้อมูลนี้สามารถเรียกได้อีกอย่างว่า เค้าร่าง (Schema) ดังนั้น DDL จึงเป็นภาษาที่ใช้ในการสร้างเค้าร่างนั่นเอง ตัวอย่างเช่น จะกำหนดว่าฐานข้อมูลที่สร้างมีชื่อว่าอะไร มีโครงสร้างที่ประกอบด้วยตารางที่ชื่ออะไรบ้าง แต่ละตารางประกอบด้วยเขตข้อมูลใดบ้าง เขตข้อมูลแต่ละตัวมีประเภทของข้อมูลเป็นอะไร มีความกว้างของข้อมูลเท่าใด แต่ละตารางมีการให้ดัชนี ช่วยในการค้นหาข้อมูลหรือไม่ ถ้ามีจะใช้เขตข้อมูลใดบ้างที่เป็นคีย์ เป็นต้น

– DML องค์ประกอบของภาษาในรูปแบบที่ 2 ของภาษา SQL ซึ่ง DML เป็นภาษาที่ใช้จัดการข้อมูลภายในตารางของฐานข้อมูล เช่น คำสั่งการเรียกค้นระเบียนข้อมูล (SELECT) คำสั่งการเพิ่มระเบียนข้อมูล (INSERT) คำสั่งการเปลี่ยนแปลงระเบียนข้อมูล (UPDATE) และคำสั่งลบระเบียนข้อมูล (DELETE) เป็นต้น

– ภาษาสำหรับการควบคุมข้อมูล (Data Control Language : DCL) เป็นส่วนของภาษาที่ใช้ควบคุมความถูกต้องของข้อมูล และควบคุมความปลอดภัยของข้อมูล ทำการป้องกันการเกิดเหตุการณ์ที่ผู้ใช้งานหลายคนเรียกใช้ข้อมูลพร้อมกัน โดยจะทำหน้าที่ควบคุมความถูกต้องของการใช้ข้อมูลและทำการลำดับการใช้ข้อมูลของผู้ใช้งานแต่ละคน และตรวจสอบสิทธิในการใช้ข้อมูลนั้นๆ เช่น GRANT คือ การให้สิทธิในการเข้าถึงข้อมูล REVOKE คือการยกเลิกสิทธิในการเข้าถึงข้อมูล เป็นต้น

4) Application programs objected code เป็นส่วนที่ทำหน้าที่ในการแปลงคำสั่งต่างๆ ของโปรแกรมรวมทั้งคำสั่งในกลุ่ม SQL ให้อยู่ในรูปของ Object code ที่จะส่งต่อไปให้ Database manager เพื่อกระทำกับฐานข้อมูล

ภาพแสดงโครงสร้างของระบบการจัดการฐานข้อมูล (DBMS)
ที่มา : //www.cs.uwyo.edu/~yu/DBMS/images/db.jpg

8. การออกแบบฐานข้อมูล (Database design) ในการดำเนินการด้านข้อมูลให้มีประสิทธิภาพนั้นจำเป็นที่จะต้องมีระบบฐานข้อมูลที่ดีเพื่อที่จะสามารถทำให้การจัดการข้อมูลในด้านต่างๆ เกิดประสิทธิภาพสูงสุดซึ่งส่วนสำคัญที่เป็นหัวใจสำคัญในการที่จะทำระบบฐานข้อมูลที่ถูกจัดสร้างขึ้นมีประสิทธิภาพมาก หรือน้อยเพียงใดก็ตามนั้นต้องมาจาก “การออกแบบฐานข้อมูล” ซึ่งในการออกแบบฐานข้อมูลที่ดีสามารถสรุปเป็นแนวทางได้ดังนี้

1) Database Initial คือ ขั้นตอนที่ผู้พัฒนาระบบฐานข้อมูลต้องวิเคราะห์ความต้องการต่างๆ ของผู้ใช้เพื่อกำหนดจุดมุ่งหมาย ปัญหา ขอบเขต และกฎระเบียบต่างๆ ของระบบฐานข้อมูลเพื่อใช้เป็นแนวทางในการออกแบบฐานข้อมูลในขั้นตอนต่อไป

2) Database design คือ ขั้นตอนที่นำเอารายละเอียดต่างๆ ที่ได้ทำการศึกษาและวิเคราะห์ความต้องการในขั้นตอนที่ 1 มากำหนดเป็นแนวทางในการออกแบบฐานข้อมูลขึ้นมาใช้งาน ซึ่งจะแบ่งการออกแบบฐานข้อมูลออกเป็น 3 ระดับ ดังนี้

– การออกแบบฐานข้อมูลระดับแนวคิด (Conceptual database design) เป็นระดับที่อธิบายถึงข้อมูลและความสัมพันธ์กันของข้อมูลในระบบที่เราวิเคราะห์มา โดยกำหนดจากความต้องการของผู้ใช้ ว่าต้องมีข้อมูลอะไรบ้าง และข้อมูลแต่ละตัวมีความสัมพันธ์กันอย่างไร และมีข้อจำกัดอะไรบ้าง โดยสิ่งที่กำหนดออกมาจากองค์ประกอบต่างๆ นั้นจะนำมาสร้างเป็นเค้าร่างของฐานข้อมูล

– การออกแบบฐานข้อมูลในระดับตรรกะ (Logical database design) การออกแบบฐานข้อมูลในระดับนี้จะอาศัยเค้าร่าง ที่ได้จากการออกแบบในระดับแนวคิดมาปรับปรุงให้มีโครงสร้างที่เป็นไปตามโครงสร้างข้อมูลของฐานข้อมูลที่จะนำมาใช้งาน แล้วนำโครงสร้างนั้นมาอิงกับแบบจำลองข้อมูล เพื่อแปลงเป็นตาราง (Relational data model) หรือความสัมพันธ์ตามแนวคิดของแบบจำลองข้อมูล จากนั้นต้องมีการปรับปรุงโครงสร้างของฐานข้อมูลให้มีความซ้ำซ้อนกันน้อยที่สุด

– การออกแบบฐานข้อมูลในระดับกายภาพ (Physical database design) การออกแบบฐานข้อมูลในระดับนี้จะเป็นการออกแบบฐานข้อมูลในระดับสุดท้าย ในขั้นตอนนี้จะเป็นการปรับปรุงเค้าร่าง ที่ได้จากการออกแบบฐานข้อมูลในระดับตรรกะเช่นเดียวกัน แต่ในระดับนี้จะเป็นการปรับปรุงเพื่อให้โครงร่างที่ได้ออกแบบมาให้เป็นไปตามโครงสร้างของโปรแกรมด้านฐานข้อมูลที่จะใช้งานจริง

3) Implementation and loading คือ ขั้นตอนที่นำเอาเค้าร่างต่างๆ ของระบบฐานข้อมูลที่ได้ออกแบบไว้มาสร้างเป็นตัวฐานข้อมูลที่จะใช้เก็บข้อมูลจริง รวมทั้งแปลงข้อมูลของระบบงานเดิม ให้สามารถนำมาใช้งานในระบบฐานข้อมูลที่พัฒนาขึ้นใหม่ได้

4) Testing and evaluation คือ ขั้นตอนของการทดสอบระบบฐานข้อมูลที่ได้พัฒนาขึ้น เพื่อหาข้อผิดพลาดต่างๆ รวมถึงทำการประเมินความสามารถของระบบฐานข้อมูล เพื่อนำไปใช้เป็นแนวทางในการปรับปรุงให้ระบบฐานข้อมูลที่พัฒนาขึ้นสามารถรองรับความต้องการของผู้ใช้ในด้านต่างๆ ได้อย่างถูกต้องและครบถ้วน

5) Operation คือ ขั้นตอนในการนำเอาระบบฐานข้อมูลที่พัฒนาขึ้นไปใช้งานจริง

6) Maintenance and evolution คือ ขั้นตอนที่เกิดขึ้นระหว่างการใช้งานระบบฐานข้อมูลจริง เพื่อบำรุงรักษาให้ระบบฐานข้อมูลทำงานได้อย่างมีประสิทธิภาพ รวมทั้งเป็นขั้นตอนของการแก้ไขและปรับปรุงระบบฐานข้อมูลในกรณีที่มีการเพิ่ม หรือเปลี่ยนแปลงความต้องการของผู้ใช้ที่อาจจะส่งผลกระทบต่อระบบฐานข้อมูล

9. ฐานข้อมูลระบบสารสนเทศทางภูมิศาสตร์ (Geographic Information System Database)

1) ข้อมูลระบบสารสนเทศทางภูมิศาสตร์ มีองค์ประกอบหลัก 3 ส่วน ได้แก่ ข้อมูลเชิงพื้นที่ ข้อมูลลักษณะประจำ และช่วงเวลา (Temporal) โดยสามารถแสดงความสัมพันธ์ระหว่างองค์ประกอบของข้อมูลภูมิศาสตร์ด้วยแผนภูมิ Geographical Data Matrix

ภาพแสดงความสัมพันธ์ระหว่างองค์ประกอบข้อมูลภูมิศาสตร์
ที่มา : ดัดแปลงจาก ศรีสอาด ตั้งประเสริฐ (2541)

จากข้อมูลที่มีความสัมพันธ์กันดังกล่าวข้างต้น ได้ถูกนำมาใช้งานในระบบสารสนเทศทางภูมิศาสตร์โดยมีการแบ่งประเภทของข้อมูลดังต่อไปนี้

– ข้อมูลเชิงพื้นที่ คือ ข้อมูลที่แสดงถึงลักษณะทางด้านกายภาพของสิ่งต่างๆ ที่ปรากฏอยู่บนพื้นผิวโลกโดยสามารถถ่ายทอดออกมาในรูปแบบการแสดงผลบนแผนที่ได้ในลักษณะของสัญลักษณ์อันประกอบด้วย จุด เส้น และพื้นที่ ข้อมูลเชิงพื้นที่ดังกล่าวต้องสามารถอ้างอิงกับพิกัดทางภูมิศาสตร์ได้ ลักษณะของข้อมูลเชิงพื้นที่ในระบบสารสนเทศภูมิศาสตร์ยังสามารถจำแนกออกได้ดังต่อไปนี้

• แรสเตอร์ (Raster) ข้อมูลแบบแรสเตอร์มีโครงสร้างเป็นช่องสี่เหลี่ยม เรียกว่า จุดภาพ หรือกริดเซลล์ (Grid cell) เรียงต่อเนื่องกันในแนวราบและแนวดิ่ง (ภาพที่ 4.19) ในแต่ละจุดภาพสามารถเก็บค่าได้ 1 ค่าโครงสร้างข้อมูลแบบแรสเตอร์สามารถจัดเก็บข้อมูลเชิงพื้นที่โดยการแทนค่าข้อมูลจากพื้นที่จริงลงในจุดภาพซึ่งมีตำแหน่งตามแนวแกน X และ Y ตรงกัน ค่าที่เก็บในแต่ละจุดภาพสามารถเป็นได้ทั้งข้อมูลลักษณะสัมพันธ์ หรือรหัสที่ใช้อ้างอิงถึงข้อมูลลักษณะสัมพันธ์ที่เก็บอยู่ในฐานข้อมูลก็ได้

ภาพแสดงลักษณะของข้อมูลแบบแรสเตอร์
  • เวกเตอร์ (Vector) คือ ข้อมูลที่สร้างขึ้นโดยอ้างอิงกับข้อมูลแรสเตอร์เพื่อใช้เป็นตัวแทนของสิ่งที่ปรากฏอยู่บนพื้นที่จริงโดยจะแสดงในรูปแบบของจุด เส้น และพื้นที่ (ภาพที่ 4.20) ซึ่งในทางคณิตศาสตร์คุณสมบัติของเวกเตอร์ต้องประกอบด้วย จุดเริ่มต้น ขนาด และทิศทาง

จุด เป็นหน่วยย่อยที่สุดของเวกเตอร์ ซึ่งมีจุดเริ่มต้น โดยขนาดและทิศทางมีค่า 0 จุดเป็นเพียงตำแหน่งซึ่งไม่สามารถวัดพื้นที่ได้

เส้น ประกอบด้วยเวกเตอร์ซึ่งมีลักษณะเป็นเส้นตรงเรียงต่อเนื่องกันเป็นลำดับเส้นมีเพียง 1 มิติ คือ มีความยาว แต่ไม่มีความกว้าง

พื้นที่ ประกอบด้วยเวกเตอร์ที่เรียงต่อเนื่องกันเป็นอนุกรม ซึ่งมีลักษณะเป็นเส้นปิด ดังนั้น ข้อมูลประเภทอาณาบริเวณจึงสามารถวัดพื้นที่ได้

ภาพแสดงการใช้เวกเตอร์เป็นตัวแทนข้อมูลในพื้นที่

– ข้อมูลลักษณะประจำ คือ ข้อมูลที่เกี่ยวกับลักษณะหรือคุณลักษณะเฉพาะของข้อมูลเชิงพื้นที่ในแต่ละช่วงเวลา ซึ่งได้มาจากเอกสารหลักฐานที่ได้ถูกบันทึกไว้ของผู้ใช้ข้อมูล หรือได้มาจากแบบฟอร์ม ตาราง รายงานหรือจากการวัดค่าของข้อมูลเชิงพื้นที่นั้นๆ ข้อมูลลักษณะประจำนี้จะมีลักษณะเป็นข้อความ (Character) หรือเป็นตัวเลขซึ่งโดยทั่วไปข้อมูลลักษณะประจำในระบบสารสนเทศทางภูมิศาสตร์จะถูกจัดเก็บในรูปแบบของตาราง และมีแบบจำลองข้อมูลเป็นแบบข้อมูลเชิงสัมพันธ์

ภาพแสดงรายละเอียดข้อมูลในระบบสารสนเทศภูมิศาสตร์

10. ความสัมพันธ์ของข้อมูลในระบบสารสนเทศภูมิศาสตร์ จากที่ทราบแล้วว่าข้อมูลในระบบสารสนเทศทางภูมิศาสตร์แบ่งออกเป็นข้อมูลเชิงพื้นที่และข้อมูลลักษณะประจำ ซึ่งข้อมูลทั้งสองประเภทนี้จะเกี่ยวเนื่องสัมพันธ์กัน โดยข้อมูลลักษณะประจำจะบ่งบอกถึงลักษณะเฉพาะตัวของข้อมูลเชิงพื้นที่แต่ละชนิด ณ ช่วงเวลาใดเวลาหนึ่ง ซึ่งจากความสัมพันธ์ดังกล่าวนี้จะช่วยให้สามารถทำความเข้าใจสภาพพื้นที่ได้อย่างชัดเจน ช่วยให้สามารถทำการวิเคราะห์พื้นที่ในด้านต่างๆ ได้อย่างรวดเร็วและมีประสิทธิภาพมากขึ้น สามารถอธิบายความสัมพันธ์ของข้อมูลได้ดังต่อไปนี้

1) ความสัมพันธ์ในข้อมูลแบบแรสเตอร์ เป็นความสัมพันธ์ที่เกิดขึ้นระหว่างข้อมูลที่เป็นโครงสร้างของข้อมูลซึ่งได้แก่ กริดเซลล์ กับข้อมูลตัวเลขที่บรรจุอยู่ในกริดเซลล์ ซึ่งทำให้สามารถแปลความหมายข้อมูลจากแรสเตอร์ได้โดยอาศัยการเรียงตัวกันของกริดเซลล์ที่มีค่าตัวเลขเป็นค่าเดียวกัน

ภาพแสดงความสัมพันธ์ระหว่างข้อมูลแรสเตอร์กับข้อมูลลักษณะประจำ
ที่มา : ดัดแปลงจาก สิริพร กมลธรรม (2549)

2) ความสัมพันธ์ในข้อมูลแบบเวกเตอร์ เนื่องจากข้อมูลแบบเวกเตอร์นี้เป็นข้อมูลที่สร้างขึ้นโดยใช้หลักการทางคณิตศาสตร์ ดังนั้นข้อมูลลักษณะประจำที่มีความสัมพันธ์กับข้อมูลเวกเตอร์นั้นนอกจากจะเป็นข้อมูลคำบรรยายโดยทั่วไป เช่น ชื่อสถานที่ จำนวนประชากร ระดับความสูง ประเภทการใช้ที่ดิน เป็นต้น ในข้อมูลแบบเวกเตอร์ยังมีข้อมูลลักษณะประจำที่ระบุถึงการอ้างอิงระหว่างข้อมูลเวกเตอร์ด้วยกันหรือบอกถึงตำแหน่งเริ่มต้นของข้อมูลอีกด้วยซึ่งเรียกว่า ทอพอโลยี

– ทอพอโลยีของจุด (Point topology) เป็นข้อมูลลักษณะประจำของค่าตำแหน่งที่เกิดข้อมูลจุดซึ่งระบบในรูปแบบของคู่พิกัด X,Y

ภาพแสดงทอพอโลยีของข้อมูลแบบจุด

– ทอพอโลยีของเส้น (Line topology) จะเป็นข้อมูลลักษณะประจำที่อ้างอิงถึงพื้นที่ทางด้านซ้าย (Left polygon) และพื้นที่ทางด้านขวา (Right polygon) ของข้อมูลเส้นที่ถูกสร้างขึ้น โดยการอ่านค่าทอพอโลยีของข้อมูลเส้น จะอ่านจากด้านบนลงด้านล่าง หรือจากด้านซ้ายไปทางด้านขวา

ภาพแสดงทอพอโลยีของข้อมูลแบบเส้น

– ทอพอโลยีของพื้นที่ (Polygon topology) จะเป็นข้อมูลลักษณะประจำของการสร้างข้อมูลแบบพื้นที่โดยระบุว่าพื้นที่ที่ถูกสร้างขึ้นนั้นประกอบด้วยข้อมูลเส้นใดๆ บ้าง

ภาพแสดงทอพอโลยีของข้อมูลพื้นที่

ที่มา : ตำราเทคโนโลยีอวกาศและภูมิสารสนเทศศาสตร์

Toplist

โพสต์ล่าสุด

แท็ก