XML คืออะไร (ตอนที่ 6)

เนื่องจากทุกวันนี้โลกของเรามีการนำเทคโนโลยีสารสนเทศเข้ามาใช้ในชีวิตประจำวันมากขึ้น และได้เข้ามาเป็นส่วนหนึ่งของการทำงาน ที่เห็นได้ชัดคือ เทคโนโลยีบนอินเทอร์เน็ต ไม่ว่าจะเป็นการเข้าไปเยี่ยมชมเว็บไซต์ต่าง ๆ หรือการส่งจดหมายอิเล็คโทรนิกส์ที่เรียกว่า E-mail ซึ่งกำลังเป็นมาตรฐานของการติดต่อสื่อสารสำหรับอนาคต ทำให้ต้องมีการคิดเพื่อพัฒนาให้มีความก้าวหน้ามากขึ้น การเขียนเว็บไซต์ในปัจจุบันนี้ โดยปกติแล้วสิ่งที่จะใช้สร้างเว็บได้คือ ภาษา HTML ที่เรารู้จักกันดีเท่านั้น แต่ว่าวันนี้โลกได้มีการพัฒนาเทคโนโลยีใหม่ที่ใช้สำหรับการเขียนเว็บ นั่นคือ XML ซึ่งเป็นสิ่งที่หลายผลิตภัณฑ์ให้การสนับสนุน

Extensive Markup Language (XML)
เป็นภาษาที่ให้ความชัดเจนในการให้รายละเอียดเกี่ยวกับข้อมูล และการเปลี่ยนแปลงข้อมูลโดยแอพพลิเคชันบนเว็บและใช้ฟอร์มที่ยืดหยุ่นได้ตามมาตรฐาน HTML หรือ Hyper Text Markup Language ได้เปิดโลกแห่งการแสดงข้อมูลต่างๆ มานำเสนอ ส่วน XML จะทำให้การทำงานกับข้อมูลโดยตรงที่เสริมกับการทำงานของ HTML

ความเป็นมาของ XML (Extensive Markup Language)
โปรโตคอลอินเตอร์เนต (Internet Protocol-IP), HypertText Markup Language และ HyperText Transport Protocol (HTTP) ได้เป็นการปฏิวัติและสร้างมิติใหม่ในการกระจายข้อมูลและสารสนเทศ การนำเสนอ ตลอดจนการค้นคืน โดยให้ผู้ใช้สามารถใช้สารสนเทศที่ต้องการได้ง่ายด้วยเบราวเซอร์ และมี search engine หรือเครื่องมือในการช่วยค้นหา นอกจากนั้นยังมีการประยุกต์ไปใช้กับเครือข่ายในสำนักงานหรืออินเตอร์เน็ต และใช้สำหรับการบริการข้อมูลสำหรับลูกค้าและคู่ค้าให้สามารถตอบสนองทางด้านสารสนเทศที่ต้องการ ได้อย่างมีประสิทธิภาพมากขึ้น

สำหรับ Extensive Markup Language จะให้ประโยชน์อย่างเต็มที่เมื่อทำงานร่วมกับ HTML ด้วยเหตุที่ว่า XML ได้มีความพร้อมในแง่ของรายละเอียด และการนำข้อมูลตลอดจนโครงสร้างข้อมูลมาแสดงได้ในรูปแบบ Text ผ่านทาง HTTP ที่เปิดให้ข้อมูลขึ้นใหม่และมีความสามารถในการจัดข้อมูลได้อีกด้วย ในการเขียนเว็บเพจเมื่อใช้ HTML ผู้พัฒนาสามารถกำหนดได้ว่าส่วนไหนจะเป็นตัวหนา ตัวเอียง หรือตัวอักษรเป็นแบบไหน ส่วน XML นั้นจะเป็นการเตรียมส่วนของข้อมูลที่จะนำไปใส่ในช่องที่กำหนดตามการเขียนของ HTML ยกตัวอย่างเช่น ข้อมูลด้านราคา หรือราคาที่ตั้งสำหรับการจัดรายการส่งเสริมการขาย อัตราภาษี ค่าขนส่ง เป็นต้น

XML ถือได้ว่าเป็นส่วนหนึ่งของ Standard Generalized Language Markup Language (SGML) ที่เป็นข้อกำหนดในการสร้างหรือจัดทำเอกสารในรูปแบบอิเล็คทรอนิกส์ที่กำหนดโดย W3C หรือ World Wide Web Consortium สามารถดูรายละเอียดเพิ่มเติมได้จาก http://www.w3.org/TR/REC-xml ที่มีโครงสร้างและรูปแบบที่เปิดให้แอพพลิเคชันต่างๆ สามารถเรียกไปใช้งานได้ เช่น บนเว็บไซต์ต่างๆ เป็นต้น และทางไมโครซอฟท์ได้มีการทำงานร่วมกับ W3C เพื่อพัฒนามาตรฐานข้อมูลบนเว็บที่ให้ HTML สามารถแสดงข้อมูลที่ XML ได้เตรียมไว้ และทางไมโครซอฟท์เองได้มีการเปิดตัว เบราว์เซอร์ตั้งแต่ IE 4.0 เป็นต้นไป ที่สามารถเรียกดูและประมวลผลข้อมูลได้ และเป็นข้อกำหนดให้ เบราว์เซอร์เวอร์ชันใหม่ของค่ายไมโครซอฟท์สนับสนุน XML

สิ่งที่ถือได้ว่าเป็นเสน่ห์ของ XML 
นั้นจะเป็นความสะดวกในการจัดการด้านระบบการติดต่อกับผู้ใช้จากโครงสร้างของข้อมูล เราสามารถนำข้อมูลจากหลายแหล่งมาแสดงผลและประมวลผลร่วมกันได้ ไม่ว่าจะเป็นข้อมูลลูกค้า รายการสั่งซื้อ ผลการวิจัย รายการรับชำระเงินข้อมูลเวชระเบียน รายการสินค้าหรือข้อมูลสารสนเทศอื่นๆ ก็สามารถแปลงให้เป็น XML ได้ และในส่วนของข้อมูลสามารถปรับให้เป็น HTML ได้

สำหรับประโยชน์ในการใช้งานนั้น
เราจะสามารถนำมาใช้สำหรับการเข้าถึงระบบข้อมูลขนาดใหญ่ใช้กับระบบเครือข่ายในองค์กร หรืออินเตอร์เนตเพื่อดูข้อมูลหรือเรียกใช้ข้อมูลที่ให้การแสดงผลทางหน้าจอที่รวดเร็วและง่ายในการจัดการ

XML (Extensive Markup Language) คืออะไร
Extensive Markup Language เป็นฟอร์แมตที่อธิบายถึงรายละเอียดของโครงสร้างและแบบของข้อมูลเป็นภาษาหรือชุดคำสั่งเกี่ยวกับข้อมูลบนเว็บ ที่ให้การพัฒนาและมีศักยภาพในส่วนของโครงสร้างข้อมูลจากหลากหลายแอพพลิเคชันมานำเสนอบนเครื่องเดสก์ทอป ด้วย XML จะทำให้การจัดการข้อมูลหรือเรียกใช้ข้อมูลจากแอพพลิเคชันต่างๆ จะเข้าสู่มาตรฐานเดียวกัน

XML จะเป็นส่วนหนึ่งของ HTML ซึ่ง XML จะให้รายละเอียดเกี่ยวกับข้อมูล เช่น ชื่อเมือง อุณหภูมิ ความกดอากาศ ส่วน HTML เป็นการกำหนด tag ต่างๆ ที่จะทำให้ข้อมูลแสดงออกมาในรูปแบบไหน ซึ่งข้อมูลจะสามารถแสดงออกมาได้หลายรูปแบบ ไม่ว่าจะเป็นตารางหรือ text ธรรมดา ขึ้นอยู่กับการกำหนดของ HTML และในปัจจุบันนี้ ด้วย XML จะมีการให้รายละเอียดของเนื้อหาเอกสารที่เรียกว่า Document Type Definition (DTD) ที่ให้รายละเอียดเกี่ยวกับตัวเอกสารว่าจะแสดงหรือซ่อนส่วนไหนของเอกสารบ้าง ซึ่ง DTD จะเป็นส่วนที่เพิ่มเติมสำหรับ XML ถ้าหากมีการส่งข้อมูลในรูปแบบ DTD ก็จะรู้กันว่าเป็น XML มีความหมายหลาย ๆ คำที่ อธิบายลักษณะของ XML

Richard Baldwin นิยามความหมายของ XML ไว้ดังนี้
"XML ทำให้ผู้ใช้สามารถสร้างและดูแล structured documents (เอกสารที่มีโครงสร้าง) ที่บรรจุ plain text (ตัวอักษร) โดยทำให้สามารถ rendered หรือปรับเปลี่ยนการแสดง ผลในรูปแบบที่หลากหลาย จุดประสงค์หลักของ XML คือการแยกส่วน ข้อมูลเพื่อประโยชน์ในการแสดงผล"

ตามข้อความด้านบน สามารถอธิบายความหมายของคำศัพท์ ได้ดังนี้
- Structured document
พิจารณาจากตัวอย่างโครงสร้างของ หนังสือ ต่อไปนี้ดู
o หนังสือหนึ่งเล่มประกอบจากเนื้อหาแต่ละบท (chapter)
o ในแต่ละบทประกอบด้วยหัวข้อย่อย (section)
o ในแต่ละหัวข้อย่อย อาจจะถูกอธิบายหรือมีตารางข้อมูล (table) บรรจุอยู่
o ตารางข้อมูลถูกสร้างขึ้นมาจากแถว (row) และคอลัมน์ (column)
ดังนั้น จะเห็นว่าหนังสือแต่ละเล่ม มักจะมีรูปแบบ หรือโครงสร้างที่แน่นอน ซึ่งทุกคนที่หยิบหนังสือขึ้นมาอ่าน ก็จะเข้าใจโครงสร้างของหนังสือ ตามที่ได้อธิบายไว้ข้างต้น

- Plain text
ตัวอักษร(Character) ที่เห็นในจดหมายหรือบนกระดาษทั่วไป เป็นลักษณะตัวอักษรประเภทที่พิมพ์ได้ (alphabet and punctuation) เช่นที่เราใช้พิมพ์ในเอกสารในเวิร์ดหรือ โปรแกรมพิมพ์รายงานทั่วไป ซึ่งรวมถึงตัวเลขด้วย ถือว่าเป็น plain text ทั้งนี้และทั้งนั้น ผู้อ่านอาจจะสงสัยว่า แล้วตัวอักษรอะไรพิมพ์ไม่ได้หรือ ลองมองดูที่คีย์บอร์ดของท่าน แล้วดูที่แป้น Shift, Ctrl, Alt, Insert, Delete, ... เหล่านี้เป็นต้น

ASCII คือที่มาของรหัสตัวอักษร: รูปแบบที่ใช้แทนตัวอักษรที่นิยมใช้กันมากที่สุด เราเรียกว่า (ASCII) โดยจะแทนตัวอักษรด้วยรหัสหรือค่าตัวเลข เช่น ตัวอักษร "A" ถูกแทนด้วยค่า 65 ในขณะที่ตัวอักษร "B" แทนด้วยค่า 66 และ "C" คือ 67 ตามลำดับ รหัส ASCII นี้เอง ซึ่งถูกนำมาใช้งานในการแสดงข้อมูล รูปแบบเอกสาร ที่สามารถพิมพ์ให้ผู้ใช้ได้เห็นในขณะที่การบันทึกบนระบบคอมพิวเตอร์ จะใช้ในการเก็บเป็นตัวเลขแทน ASCII เป็นคำย่อที่มาจาก American Standards Committee on Information Interchange โดยเป็นองค์กรที่จะตั้งขึ้นมาดูแล รหัสคำสั่งต่างๆเหล่านี้ แต่ในความเป็นจริงนอกจาก ASCII จะเก็บบันทึกตัวอักษรแล้ว ยังมีรหัสที่แทนตัวอักษร ต่อไปนี้เป็นความหมายที่ทำให้เข้าใจความเกี่ยวข้องระหว่างรหัส ASCII กับ Plain text
"มาตรฐานที่เกิดจาก American Standards Committee on Information Interchange คือแนวทางที่ถูกใช้ในการกำหนดลักษณะของ plain text กล่าวคือตัวอักษรที่สามารถอ่านได้ โดยไม่ต้องใช้ความสามารถ ของโปรแกรมใดๆมาช่วยในการอ่านตัวอักษรเหล่านั้น ข้อพิเศษของ ASCII อีกอย่างหนึ่งคือ เป็นข้อมูลที่สามารถ นำไปแสดงได้ในทุกๆแพลตฟอร์ม แต่ก็มีข้อเสียที่ เป็นรูปแบบที่น่าเบื่อ (ไม่สวยงาม) ไม่สามารถแสดงในรูปแบบตัวหนา ตัวเอียง หรือขีดเส้นใต้ และไม่มีรูปแบบที่ดูเป็นกราฟฟิก แต่อย่างไรก็ตาม ถือว่าเป็นแบบในการแสดงตัวอักษรที่ง่ายที่สุด และเข้าใจได้ในทุก ๆ ระบบ"

ข้อมูลดิบของเอกสาร XML (Raw-XML)
เอกสาร XML ที่ถือเป็นข้อมูลดิบ คือข้อความที่เกิดจากการรวมกันของตัวอักษร เพื่อทำให้เกิดเป็นเอกสาร ก่อนที่จะนำเอกสารที่เกิดจากข้อมูลดิบ มาใช้แสดงผลลัพธ์ตามวัตถุประสงค์ของการใช้งานอีกที ซึ่งเป็นรูปแบบที่น่าสนใจมากกว่า plain text

ความหมายของการปรับการแสดงผล (Rendering)
เป็นศัพท์สำหรับคอมพิวเตอร์สมัยใหม่ rendering คือรูปแบบของการนำข้อมูลดิบ หรือ plain text มาปรับเปลี่ยนใหม่ ให้ดูน่าสนใจยิ่งขึ้น สำหรับการมองของมนุษย์ Rendering เป็นการวาดภาพ (Drawing) ตัวอย่างของการวาดภาพในระบบคอมพิวเตอร์ เป็นการนำเอาสมการ ทางคณิตศาสตร์ มาใช้ร่วมกับตัวเลขต่างๆ เช่น สมการวาดวงกลม กับค่าตัวเลขหนึ่งให้วงกลมขนาดหนึ่ง กับอีกตัวเลข ให้วงกลมในอีกหนึ่งขนาด ซึ่งตัวเลขและสมการเหล่านี้ เป็นสิ่งที่มนุษย์ หรือผู้ใช้งานไม่อาจได้เห็นเลย แต่จะเห็นเป็นรูปร่างที่เกิดขึ้นแทน

Rendering เอกสาร: เมื่อพูดถึงขบวนการ rendering ของเอกสาร มีความหมายว่าเป็นการแสดงข้อมูลในรูปแบบเอกสาร ที่มนุษย์เข้าใจ เช่นหนังสือ หนังสือพิมพ์ หรือเอกสารแบบอื่นๆ ที่มนุษย์เข้าใจ และอ่านได้ Rendering ในที่นี้ หมายถึงการแสดงข้อมูลในรูปแบบ อักษรตัวหนา, อักษรตัวเอียง, อักษรขีดเส้นใต้, อักษรที่มีสี, เป็นต้น

แยกการแสดงผลด้วยเนื้อหา: ข้อมูลที่สร้างขึ้นเป็น XML ไม่มีความสามารถ หรือคุณลักษณะพิเศษอะไร ที่ทำให้การแสดงผลออกมาในรูปแบบที่น่าสนใจ เช่น ตัวหนา ตัวเอียง ตัวขีดเส้นใต้ ดังที่กล่าวผ่านมาแล้ว ให้จำแต่เพียงว่า XML ทำหน้าที่แยกข้อมูลออกเป็นเนื้อหา (Content) เท่านั้น ตามลักษณะเอกสารที่มีโครงสร้าง ส่วนหน้าที่การนำเอาเนื้อหาใน XML มาแสดงในรูปแบบที่น่าสนใจ เป็นหน้าที่การทำงานของส่วนอื่น
ข้อความจาก http://www.thaixml.com
ผู้เขียน goragod โพสต์เมื่อ 03 เม.ย. 2551 เปิดดู 20,448 ป้ายกำกับ XML คืออะไร
^