ก่อนที่เราจะเรียนรู้เกี่ยวกับแนวคิดเช่นแบบจำลองข้อมูล ศึกษาประเภท การจำแนกประเภท และพิจารณาคำอธิบายโดยละเอียด จำเป็นต้องเข้าใจความหมายที่แท้จริงของวิทยาการคอมพิวเตอร์ ซึ่งรวมถึงแนวคิดเหล่านี้และทุกสาขา, มันศึกษา ในบทความนี้ เราจะพิจารณาคำศัพท์พื้นฐานและเสาหลักของวิทยาศาสตร์นี้ โดยเฉพาะอย่างยิ่ง เราจะพูดถึงประเภทของโครงสร้างข้อมูล ความสัมพันธ์ในนั้น และอื่นๆ อีกมากมาย
สารสนเทศและสารสนเทศคืออะไร
หากต้องการศึกษาโครงสร้างของตัวแบบข้อมูล คุณต้องเข้าใจว่าข้อมูลนี้ในหลักการคืออะไร
ในทุกช่วงเวลาของการดำรงอยู่ของสังคมมนุษย์ ข้อมูลมีบทบาทอย่างมาก กล่าวคือ ข้อมูลที่บุคคลได้รับจากโลกที่กว้างใหญ่และหลากหลายรอบตัวเรา ตัวอย่างเช่น แม้แต่คนดึกดำบรรพ์ก็ทิ้งข้อมูลเกี่ยวกับวิถีชีวิตและประเพณีอันเรียบง่ายของพวกเขาไว้ให้เราด้วยความช่วยเหลือของภาพเขียนหิน
ตั้งแต่นั้นเป็นต้นมา ผู้คนได้ค้นพบทางวิทยาศาสตร์มากมาย รวบรวมข้อมูลเกี่ยวกับรุ่นก่อนและรวบรวมข้อมูลจากทุกวันข่าวจึงได้รับข้อมูลจำนวนมากขึ้นเรื่อยๆ และให้คุณภาพเช่นมูลค่าและความน่าเชื่อถือ
เมื่อเวลาผ่านไป ปริมาณข้อมูลก็มหาศาลและมหาศาลเสียจนมนุษย์ไม่สามารถเก็บมันไว้ในหน่วยความจำได้อย่างอิสระ ประมวลผลด้วยตนเอง และดำเนินการใดๆ กับข้อมูลนั้น นั่นคือเหตุผลที่มีความจำเป็นสำหรับวิทยาศาสตร์พื้นฐานในปัจจุบัน - สารสนเทศ ขอบเขตซึ่งรวมถึงสาขาของกิจกรรมของมนุษย์ที่เกี่ยวข้องกับการเปลี่ยนแปลงต่างๆ ของข้อมูล สารสนเทศครอบคลุมเกือบทุกด้านในชีวิตของเรา ตั้งแต่การคำนวณทางคณิตศาสตร์อย่างง่ายไปจนถึงวิศวกรรมที่ซับซ้อนและการออกแบบสถาปัตยกรรม ตลอดจนการสร้างภาพยนตร์แอนิเมชั่นและแอนิเมชั่น มันกำหนดเป้าหมายพื้นฐานเช่นการประมวลผลอัตโนมัติ โครงสร้าง การจัดเก็บและการส่งข้อมูล
ในหัวข้อของวันนี้ เราจะพูดถึงโครงสร้างของข้อมูลโดยเฉพาะ กล่าวคือ เราจะพูดถึงตัวแบบข้อมูล อย่างไรก็ตาม ก่อนหน้านั้น ประเด็นอื่นๆ ที่เกี่ยวข้องโดยตรงกับหัวข้อการสนทนาของเราควรได้รับการชี้แจง กล่าวคือ: ฐานข้อมูลและ DBMS
ฐานข้อมูลและ DBMS
ฐานข้อมูล (DB) เป็นประเภทของข้อมูลที่มีโครงสร้าง
คำนี้หมายถึงชุดข้อมูลที่ใช้ร่วมกันซึ่งมีความเกี่ยวข้องทางตรรกะ ฐานข้อมูลคือโครงสร้างที่ใช้ในไซต์แบบไดนามิกที่มีข้อมูลจำนวนมาก ตัวอย่างเช่น นี่คือแหล่งข้อมูลของร้านค้าออนไลน์ต่างๆ พอร์ทัลของกองทุนสื่อหรือแหล่งข้อมูลอื่นๆ ของบริษัท
ระบบจัดการฐานข้อมูล (DBMS) คือชุดของซอฟต์แวร์ต่างๆ ที่ออกแบบมาเพื่อสร้างฐานข้อมูล ดูแลรักษาให้อยู่ในรูปแบบที่เหมาะสม และจัดระเบียบการค้นหาอย่างรวดเร็วสำหรับข้อมูลที่จำเป็นในฐานข้อมูล ตัวอย่างของ DBMS ที่ใช้กันอย่างแพร่หลายคือ Microsoft Access ซึ่งเผยแพร่ใน Microsoft Office บรรทัดเดียว คุณลักษณะที่โดดเด่นของ DBMS นี้คือ เนื่องจากมีภาษา VBA อยู่ในนั้น จึงเป็นไปได้ที่จะสร้างแอปพลิเคชันใน Access ที่ทำงานบนพื้นฐานของฐานข้อมูล
ฐานข้อมูลสามารถจำแนกได้ตามเกณฑ์ต่างๆ:
- ตามประเภทของรุ่น (จะถกกัน)
- ตามตำแหน่งที่จัดเก็บ (ฮาร์ดไดรฟ์, RAM, ออปติคัลดิสก์)
- ตามประเภทการใช้งาน (ในเครื่อง คือ ผู้ใช้หนึ่งรายมีสิทธิ์เข้าถึง สื่อคือ หลายคนสามารถดูข้อมูลในฐานข้อมูลได้ ทั่วไป - ฐานข้อมูลดังกล่าวตั้งอยู่บนเซิร์ฟเวอร์และคอมพิวเตอร์ส่วนบุคคลหลายเครื่อง นั่นคือความสามารถในการดูข้อมูลในพวกเขามีสิทธิ์เข้าถึงผู้คนจำนวนมาก)
- ตามเนื้อหาของข้อมูล (วิทยาศาสตร์ ประวัติศาสตร์ พจนานุกรม และอื่นๆ)
- ตามระดับความแน่นอนของฐาน (รวมศูนย์และกระจาย)
- โดยความเป็นเนื้อเดียวกัน (ต่างกันและเป็นเนื้อเดียวกันตามลำดับ)
และคุณสมบัติอื่นๆ อีกมากมายที่มีความสำคัญน้อยกว่า
ส่วนหลักของฐานข้อมูลดังกล่าวคือตัวแบบข้อมูล พวกเขาเป็นตัวแทนชุดของโครงสร้างข้อมูลและการดำเนินการสำหรับการประมวลผล ทำให้ง่ายขึ้นและเร่งกระบวนการจัดระเบียบการค้นหาข้อมูลที่จำเป็น
รูปแบบระบบข้อมูล: การจำแนกประเภท
มีฐานข้อมูลที่หลากหลาย แต่ทั้งหมดนั้นอิงตามแบบจำลองทั่วไปและพื้นฐานที่มากกว่า การจัดประเภทของแบบจำลองข้อมูลสารสนเทศยังแบ่งออกเป็นหลายประเภท หมวดหมู่ที่ใช้บ่อยที่สุด:
- แบบจำลองลำดับชั้น
- แผนภาพเครือข่าย
- โมเดลเชิงสัมพันธ์
- สคีมาเชิงวัตถุ
แบบจำลองข้อมูลทุกประเภทนี้มีความแตกต่างกันในลักษณะของการนำเสนอและการจัดเก็บข้อมูลในนั้น
เกณฑ์การเลือกรุ่นที่เหมาะสม
ผู้ใช้สามารถสร้างฐานข้อมูลด้วยประเภทใดก็ได้ข้างต้น อย่างไรก็ตาม ควรสังเกตว่าการเลือกแบบจำลองข้อมูลเป็นตัวกำหนดปัจจัยบางประการ
เกณฑ์ที่สำคัญที่สุดคือว่า DBMS ที่ไคลเอนต์ใช้สนับสนุนรุ่นใดรุ่นหนึ่งหรือไม่ DBMS ส่วนใหญ่สร้างขึ้นในลักษณะที่ผู้ใช้จะได้รับโมเดลข้อมูลที่จะใช้ อย่างไรก็ตาม DBMS บางตัวรองรับแอนะล็อกที่แตกต่างกันหลายตัวพร้อมกัน มาดูคุณสมบัติของพวกมันทีละตัวกัน
แบบจำลองลำดับชั้น
เป็นรูปแบบการนำเสนอข้อมูลประเภทหนึ่ง โดยจัดเป็นชุดขององค์ประกอบที่จัดเรียงตามลำดับจากทั่วไปถึงเฉพาะ
โครงสร้างเป็นต้นไม้คว่ำ ในการเข้าถึงไฟล์ใดไฟล์หนึ่งโดยเฉพาะมีทางเดียว
แบบจำลองลำดับชั้นต้องเป็นไปตามเงื่อนไขพื้นฐานสามประการ:
- แต่ละโหนดระดับล่างสามารถเชื่อมต่อกับโหนดระดับที่สูงกว่าได้เพียงโหนดเดียวเท่านั้น
- มีโหนดรูทหลักเพียงโหนดเดียวในลำดับชั้น ซึ่งไม่อยู่ภายใต้โหนดอื่นใดและอยู่ที่ระดับบนสุด
- มีเส้นทางเดียวไปยังโหนดใดๆ ในลำดับชั้นจากโหนดราก
ประเภทความสัมพันธ์แบบหนึ่งต่อกลุ่ม
รุ่นเครือข่าย
มันขึ้นอยู่กับลำดับชั้นเป็นหลัก ซึ่งมีหลายอย่างที่เหมือนกันกับมัน ความแตกต่างหลักระหว่างทั้งสองคือประเภทลิงก์ ซึ่งแสดงถึงความสัมพันธ์แบบกลุ่มต่อกลุ่ม หมายความว่าลิงก์สามารถมีได้ระหว่างโหนดต่างๆ
ข้อดีของรูปแบบเครือข่ายคือใช้ทรัพยากรพีซีในแง่ของหน่วยความจำและความเร็วน้อยกว่ารุ่นอื่นๆ
ข้อเสียของรูปแบบนี้คือ หากคุณต้องการเปลี่ยนโครงสร้างของข้อมูลที่เก็บไว้ คุณจะต้องเปลี่ยนแอปพลิเคชันทั้งหมดที่ทำงานบนพื้นฐานของโมเดลเครือข่ายนี้ เนื่องจากโครงสร้างดังกล่าวไม่เป็นอิสระ
โมเดลสัมพันธ์
เป็นเรื่องธรรมดาที่สุดในปัจจุบัน ออบเจ็กต์และความสัมพันธ์ระหว่างพวกเขาในแบบจำลองข้อมูลนี้แสดงโดยตาราง และความสัมพันธ์ในสิ่งเหล่านี้ถือเป็นออบเจ็กต์ คอลัมน์ในตารางดังกล่าวเรียกว่าเขตข้อมูลและแถวจะเรียกว่าระเบียน แต่ละตารางแบบจำลองเชิงสัมพันธ์ต้องเป็นไปตามคุณสมบัติดังต่อไปนี้:
- ทุกคอลัมน์จะต้องเหมือนกันหมด นั่นคือองค์ประกอบทั้งหมดที่อยู่ในคอลัมน์เดียวต้องมีประเภทเดียวกันและมีขนาดสูงสุดที่อนุญาต
- แต่ละคอลัมน์มีชื่อเฉพาะของตัวเอง
- ไม่ควรมีแถวที่เหมือนกันในตาราง
- ลำดับที่แถวและคอลัมน์ปรากฏในตารางสามารถกำหนดเองได้
โมเดลเชิงสัมพันธ์ยังคำนึงถึงประเภทของความสัมพันธ์ระหว่างตารางเหล่านี้ ซึ่งรวมถึงความสัมพันธ์แบบตัวต่อตัว แบบตัวต่อตัว และแบบกลุ่มต่อกลุ่ม
ฐานข้อมูลที่สร้างจากโมเดลเชิงสัมพันธ์แบบตารางมีความยืดหยุ่น ปรับเปลี่ยนได้ และปรับขนาดได้สูง แต่ละอ็อบเจ็กต์ข้อมูลจะถูกแบ่งออกเป็นส่วนย่อยที่เล็กที่สุดและมีประโยชน์มากที่สุด
โมเดลเชิงวัตถุ
ในรูปแบบการสร้างข้อมูลเชิงวัตถุ ฐานข้อมูลถูกกำหนดโดยชุดขององค์ประกอบซอฟต์แวร์ที่ใช้ซ้ำได้พร้อมฟังก์ชันที่เกี่ยวข้อง มีฐานข้อมูลเชิงวัตถุหลายแบบ:
- ฐานข้อมูลมัลติมีเดีย
- ฐานข้อมูลไฮเปอร์เท็กซ์
อันแรกรวมข้อมูลสื่อ มันสามารถมีรูปภาพต่าง ๆ ที่ ตัวอย่างเช่น ไม่สามารถเก็บไว้ในโมเดลเชิงสัมพันธ์
ฐานข้อมูลไฮเปอร์เท็กซ์ช่วยให้สามารถเชื่อมโยงวัตถุฐานข้อมูลใด ๆ กับวัตถุอื่นได้ วิธีนี้ค่อนข้างสะดวกสำหรับการจัดการสื่อสารในชุดข้อมูลที่แตกต่างกัน อย่างไรก็ตาม โมเดลดังกล่าวยังห่างไกลจากอุดมคติเมื่อดำเนินการการวิเคราะห์เชิงตัวเลข
บางทีโมเดลเชิงวัตถุอาจเป็นโมเดลที่ได้รับความนิยมและใช้มากที่สุด เพราะมันอาจมีข้อมูลในรูปแบบของตาราง เช่น เชิงสัมพันธ์ แต่ไม่จำกัดเฉพาะระเบียนแบบตารางไม่เหมือนกับโมเดลนี้
ข้อมูลเพิ่มเติมเล็กน้อย
ไอบีเอ็มใช้โมเดลแบบลำดับชั้นเป็นครั้งแรกในวิทยาการคอมพิวเตอร์ในทศวรรษที่ 60 ของศตวรรษที่ผ่านมาโดย IBM แต่วันนี้ความนิยมลดลงเนื่องจากประสิทธิภาพต่ำ
โมเดลข้อมูลเครือข่ายได้รับความนิยมในยุค 70 หลังจากถูกกำหนดอย่างเป็นทางการโดย Conference on Database System Languages
ฐานข้อมูลเชิงสัมพันธ์มักจะเขียนในภาษาคิวรีที่มีโครงสร้าง (SQL) โมเดลนี้ออกในปี 1970
สรุป
ดังนั้น เราสามารถสรุปปัญหาที่เราได้พิจารณาในวันนี้ด้วยข้อสรุปสั้นๆ ดังต่อไปนี้:
- ข้อมูลบนคอมพิวเตอร์ส่วนบุคคล (PC) สามารถจัดเก็บในรูปแบบฐานข้อมูลพิเศษได้
- แกนหลักของฐานข้อมูลคือโมเดล
- โมเดลข้อมูลมีสี่ประเภทหลัก: แบบลำดับชั้น เครือข่าย เชิงสัมพันธ์ เชิงวัตถุ
- ในแบบจำลองลำดับชั้น โครงสร้างดูเหมือนต้นไม้กลับหัว
- ในรูปแบบเครือข่าย มีการเชื่อมโยงระหว่างโหนดต่างๆ
- ในแบบจำลองเชิงสัมพันธ์ ความสัมพันธ์ระหว่างวัตถุจะแสดงเป็นตาราง
- ในรูปแบบเชิงวัตถุ ความสัมพันธ์ระหว่างองค์ประกอบสามารถแสดงด้วยตารางได้ แต่ไม่จำกัดเพียงองค์ประกอบเหล่านั้น
ในกรณีหลัง เช่น อาจมีข้อความและรูปภาพ