วันจันทร์ที่ 26 ตุลาคม พ.ศ. 2552

รหัสแทนข้อมูล

รหัสแทนข้อมูล
คอมพิวเตอร์ทำงานด้วยหลักการทางอิเล็กทรอนิกส์ที่แทนสัญญาณทางไฟฟ้าด้วยตัวเลขศูนย์ และหนึ่งซึ่งเป็นตัวเลขในระบบฐานสอง แต่ละหลักเรียกว่า บิต และเมื่อนำตัวเลขหลายๆบิตมา เรียงกัน จะใช้สร้างรหัสแทนความหมายจำนวน หรือตัวอักษร หรือสัญลักษณ์ ทั้งภาษาไทยและ ภาษาอังกฤษได้ และเพื่อให้การสื่อสารแลกเปลี่ยนข้อความระหว่างมนุษย์กับคอมพิวเตอร์เป็น ไปในแนวเดียวกันจึงมีการกำหนดมาตรฐานรหัสตัวเลขในระบบเลขฐานสอง สำหรับแทน สัญลักษณ์เหล่านี้ รหัสมาตรฐานที่นิยมใช้กันมากมีสองกลุ่ม คือ
1. รหัสแอสกี ( ASCII)
เป็นมาตรฐานที่นิยมใช้กันมากในระบบคอมพิวเตอร์และระบบสื่อสารข้อมูล รหัสแทนข้อมูล ชนิดนี้ใช้เลขฐานสองจำนวน 8 บิต หรือเท่ากับ 1 ไบต์แทนอักขระหรือสัญลักษณ์แต่ละตัว ซึ่งหมายความว่าการแทนอักขระแต่ละตัวจะประกอบด้วยตัวเลขฐานสอง 8 บิตเรียงกัน ซึ่ง ลำดับของแต่ละบิตเป็นดังนี้
บิตที่ 7 6 5 4 3 2 1 0
ตัวอย่างรหัสแทนข้อมูล เช่น
บิตที่7 6 5 4 3 2 1 0 อักขระที่แทน
0 0 1 1 0 1 1 1 7
0 1 0 0 0 1 1 1 G
0 1 1 0 0 1 1 1 g
จากหลักการของระบบเลขฐานสอง แต่ละบิตสามารถแทนค่าได้ 2 แบบ คือ เลข 0 หรือเลข 1 ถ้าเราเขียนเลขฐานสองเรียงกัน 2 บิต ในการแทนอักขระ เราจะมีรูปแบบในการแทนอักขระ ได้ 22 หรือ 4 รูปแบบ คือ 00,01,10 และ 11 ดังนั้นในการใช้รหัสแอสกีซึ่งมี 8 บิตใน การแทนอักขระแล้ว เราจะมีรูปแบบที่ใช้แทนได้ถึง 28 หรือ 256 รูปแบบ ซึ่งเมื่อใช้แทน ตัวอักษรภาษาอังกฤษแล้วยังมีเหลืออยู่ สำนักงานมาตรฐานผลิตภัณฑ์อุตสาหกรรม หรือ สมอ. จึงได้กำหนดรหัสภาษาไทยเพิ่มลงไปเพื่อให้ใช้งานร่วมกัน
ตารางแสดงรหัสแอสกี
2. รหัสเอบซีดิก (EBCDIC)
พัฒนาโดยบริษัทไอบีเอ็ม รหัสแทนข้อมูลนี้ไม่เป็นที่นิยมใช้แล้วในปัจจุบัน การกำหนดรหัส จะใช้ 8 บิต ต่อหนึ่งอักขระ เหมือนกับรหัสแอสกี แต่แบบของรหัสที่กำหนดจะแตกต่างกัน โดยรหัสเอบซีดิกจะเรียงลำดับแต่ละบิตที่ใช้แทนอักขระดังนี้
บิตที่ 0 1 2 3 4 5 6 7
รหัสแบบเอบซีดิก ก็สามารถใช้กำหนดให้กับอักษรภาษาไทย และเครื่องหมายอื่น ๆ ได้ เช่นเดียวกัน ตัวอย่างรหัสแทนข้อมูลแบบเอบซีดิก
บิตที่ 0 1 2 3 4 5 6 7อักขระที่แทน
1 1 1 1 0 1 1 1 7
1 1 0 0 0 1 1 1 G

1 0 0 0 0 1 1 1 g
3. รหัส UniCode
เป็นรหัสแบบใหม่ล่าสุด ถูกสร้างขึ้นมาเนื่องจากรหัสขนาด 8 บิตซึ่งมีรูปแบบเพียง 256 รูปแบบ ไม่สามารถแทนภาษาเขียนแบบต่าง ๆ ในโลกได้ครบหมด โดยเฉพาะภาษาที่เป็นภาษาภาพ เช่น ภาษาจีนหรือภาษาญี่ปุ่นเพียงภาษาเดียวก็มีจำนวนรูปแบบเกินกว่า 256 ตัวแล้ว UniCode จะเป็นระบบรหัสที่เป็น 16 บิต จึงแทนตัวอักษรได้มากถึง 65,536 ตัว ซึ่ง เพียงพอสำหรับตัวอักษรและสัญลักษณ์กราฟฟิกโดยทั่วไป รวมทั้งสัญลักษณ์ทางคณิตศาสตร์ต่าง ๆ ในปัจจุบันระบบ UniCode มีใช้ในระบบปฏิบัติการ Window NT ระบบปฏิบัติการ UNIX บางรุ่น รวมทั้งมีการสนับสนุนชนิดข้อมูลแบบ UniCode ในภาษา JAVA ด้วย

ไม่มีความคิดเห็น:

แสดงความคิดเห็น