TELECOM10 : คำศัพท์โทรคมนาคม: MOS

MOS : Mean Opinion Score

เรื่องของการวัดคุณภาพเสียงที่ผ่านเครือข่ายการสื่อสารมา ไม่ว่าจะเป็นเครือข่ายโทรศัพท์บ้าน โทรศัพท์เคลื่อนที่ หรือแม้แต่ที่กำลังอินเทรนด์อย่างเครือข่าย VoIP เป็นต้น คำว่าคุณภาพเสียงที่กล่าวมานั้น ไม่ใช่คุณภาพเสียงแบบที่เราพูดคุยกันถึงนักร้อง นักพูดแต่อย่างใดนะครับ เพราะเรากำลังพูดถึงเรื่องเครือข่ายสื่อสารข้อมูล ซึ่งในกรณีนี้ ข้อมูลที่ว่าก็คือเสียงนั่นเอง ดังนั้น คุณภาพเสียงที่ดีในที่นี้ ก็คือ เสียงจะต้องออกมาใกล้เคียงหรือเหมือนกับต้นฉบับให้มากที่สุด เสียงแหบๆ หรือเสียงใสๆ ก็ตาม เมื่อเข้าสู่เครือข่ายไป และออกมาที่อีกด้านหนึ่งนั้น ก็จะต้องได้เสียงแหบหรือเสียงใสเช่นเดิม จังหวะจะโคนเดิมๆ จึงจะนับว่ามีคุณภาพเสียงที่ดี ถ้าเสียงใสๆ เข้าไปแล้วกลายเป็นเสียงแหบๆ บี้ๆ ออกมา ก็ต้องถือว่า เครือข่ายนั้นให้คุณภาพเสียงไม่ดีพอ หรือคุณภาพของการสื่อสารใช้ไม่ได้นั่นเอง (แต่ถ้าเสียงแหบๆ เข้าไป แล้วมีเสียงใสๆ ออกมา ก็น่าจะขายได้นะครับ) ในเครือข่ายการสื่อสารสนทนา ไม่ว่าจะเป็นเครือข่ายอนาล็อก ดิจิตอล หรือเครือข่ายไอพีที่เราใช้ VoIP ก็ตาม

การวัดคุณภาพของเครือข่ายการสื่อสารที่ว่านั้นสามารถจะแบ่งได้เป็น 3 ประเภทก็คือ

1. คุณภาพเสียงที่ได้รับฟัง เป็นคุณภาพที่วัดจากเสียงที่ได้ฟังหลังจากผ่านเครือข่ายการสื่อสารออกมาแล้ว ผู้ฟังจะเป็นคนที่บอกได้ว่าคุณภาพเสียงที่ได้นั้นเป็นอย่างไร ชัดเจน เหมือนเสียงต้นฉบับหรือไม่อย่างไร ซึ่งแน่นอนว่า คุณภาพเสียงนี้แหละที่เป็นประเด็นของหัวข้อของเราในวันนี้

2. คุณภาพในการสนทนา ซึ่งคุณภาพตัวนี้นั้น จะรวมถึงคุณภาพเสียงที่ได้รับฟังและความสามารถในการตอบโต้สนทนาระหว่างการสื่อสารนั้น ดังนั้น เรื่องของเสียงสะท้อน ดีเลย์ หรือปัญหาอื่นใดที่ทำให้รำคาญใจในการสนทนาก็มีผลทั้งสิ้น แต่เรื่องนี้เราสามารถที่จะทำการวัดได้ในเรื่องของ latency หรือวิธีการทั่วไปในเครือข่ายการสื่อสาร และจะไม่ขอกล่าวถึงในที่นี้นะครับ

3. คุณภาพการเชื่อมต่อของเครือข่าย ไม่ว่าจะเป็นเรื่องการเชื่อมต่อนั้นเสถียรเพียงใด มีการหลุดมากน้อยเพียงใด เป็นต้น เราจำเป็นที่จะต้องทำการวัดคุณภาพเสียงที่ได้รับฟังนั้นเพื่อที่จะทำการประเมินคุณภาพเครือข่าย เทคโนโลยีที่ใช้ Codec เป็นต้น ซึ่งแน่นอนว่าการวัดคุณภาพของ VoIP ก็รวมอยู่ด้วย แต่มีวิธีการอะไรบ้างล่ะ ที่จะช่วยทำการวัดคุณภาพเสียงที่ได้นั้นได้อย่างถูกต้อง เป็นมาตรฐาน เพื่อที่จะทำการเปรียบเทียบได้ ก็จะว่ากันไปแต่ละวิธีเลยนะครับ Mean Opinion Score (MOS)เป็นวิธีการแรกสุดที่เกิดขึ้นและได้รับการยอมรับอย่างแพร่หลายก็คือ Mean Opinion Score หรือ MOS ซึ่งมีต้นกำเนิดจากเครือข่ายโทรศัพท์ ซึ่งได้มีการกำหนดเป็นมาตรฐานโดย ITU-T เรียกว่า ITU-T P.800 ส่วนวิธีการหรือครับ ลองเดาดูสิครับ ใบ้นิดอยู่ในชื่อของมันอยู่แล้ว ครับ วิธีการนั้นก็เข้าใจง่ายๆ ครับ ในเมื่อมันเป็น Opinion หรือความเห็น ก็ต้องใช้คนสิครับ แต่ เอ... ใช้คนเหรอ แล้วจะเชื่อถือได้ไหมเนี่ย เชื่อถือได้ครับ เพราะไม่ใช่แค่การจะเอาใครสักคนก็ได้มานั่งฟังแล้วก็บอกว่า คุณภาพเป็นอย่างไร ให้คะแนนเท่าไรเท่านั้นนะครับ มันมีการกำหนดวิธีการเอาไว้ด้วยใน P.800 นั้น วิธีการก็คือ เอาคนหลายๆ คน ซึ่งก็แน่นอนว่า ต้องเอาคนที่มีทักษะในการฟัง การแยกแยะพอสมควร และความเชื่อถือได้หรือไม่นั้น ก็ขึ้นกับจำนวนคนที่นำมาทดสอบนั้น ยิ่งมากเท่าไร ก็ยิ่งเชื่อถือได้มากขึ้นเท่านั้น โดยให้ฟังไฟล์ออดิโอต่างๆ ในสภาพที่เงียบที่สุด และให้ผู้ฟังแต่ละคนให้คะแนนซึ่งมีตั้งแต่ 1 ถึง 5 โดย 1 ถึง 5 นั้นจะมีความหมายดังนี้

MOS คุณภาพ ลักษณะ

5 Excellent ยอดเยี่ยม คาดไม่ถึง (Imperceptible)

4 Good ดี ใช้ได้ดี (Perceptible)

3 Fair พอใช้ น่าหงุดหงิดเล็กน้อย (Slightly annoying)

2 Poor ไม่ดี ไม่น่าพอใจ (Annoying)

1 Bad แย่ ไม่พอใจ (Very annoying)

ค่า MOS และระดับคุณภาพของเสียง หลังจากที่ได้คะแนนของแต่ละคนมา ก็จะทำการคำนวณหาค่าเฉลี่ย ซึ่งแน่นอนว่าโอกาสที่จะได้คะแนนเต็มนั้นยากเหลือเกิน ถ้าไม่ยอดเยี่ยมประเสริฐศรีจริงๆ ก็คงจะไม่ได้ 5 หรอกครับ ตัวอย่างของคะแนนที่ได้ในแต่ละเทคโนโลยีก็ได้แสดงไว้ เช่น G.711 ก็จะได้คะแนน 4.3โดยเฉลี่ย ซึ่งถือว่าเป็นคะแนนที่ดีมากทีเดียว และการเข้า Codec แบบอื่นๆ ก็จะได้คะแนนแตกต่างกันไปตามคุณภาพเสียงที่ประเมินออกมา ซึ่งเราจะสังเกตกันว่า การทดสอบและประเมินคุณภาพเสียงเช่นนี้นั้น เป็น Subjective ขึ้นกับตัวบุคคลมาก มีความแตกต่างกันได้มากทีเดียว จึงทำให้ต้องมีการใช้จำนวนคนมากๆ เพื่อเพิ่มความน่าเชื่อถือและลดประเด็นที่เป็น Subjective นี้ลงไป

ชนิดของ CODEC Data Rate MOS

G.711 (ISDN) 64 kbps 4.3

AMR 12.2 kbps 4.14

GSM EFR 12.2 kbps 3.8

G.726 ADPCM 32 kbps 3.8

G.729 8 kbps 3.92

GSM FR 12.2 kbps 3.5

ของ CODEC และค่า MOS ที่ได้และเพื่อเป็นการเพิ่มความน่าเชื่อถือในการวัดคุณภาพเสียงด้วยวิธีนี้ ทาง ITU-T ก็ได้กำหนดวิธีการทดสอบเพิ่มเติม โดยมีการกำหนดข้อความที่ใช้ทดสอบนั้น ซึ่งเป็นข้อความที่เรียกว่า Harvard Sentences ที่ในการออกเสียงจะช่วงความถี่เสียงทั้งหมดที่พบในคำพูดคำสนทนาทั่วไป ทำการบันทึกด้วยความละเอียดสูงแบบ 16 บิต ตัวอย่างของข้อความดังกล่าว ก็ได้แก่

You will have to be very quiet.

There was nothing to be seen.

They worshipped wooden idols.

I want a minute with the inspector.

Did he need any money?

เนื่องจากวิธีการดังกล่าวนั้น จะเน้นที่คุณภาพเสียงที่ได้รับฟัง จึงมักใช้ในการทดสอบ Codec กันมาก และเป็นวิธีที่ได้รับการยอมรับกันมากที่สุด และใช้เป็นมาตรฐานในการเปรียบเทียบวิธีการอื่นๆ ว่าเชื่อถือได้มากน้อยเพียงใด แต่วิธีการนี้ จะค่อนข้างยุ่งยาก สิ้นเปลืองทีเดียว ทั้งการหาผู้ที่มีทักษะมาจำนวนมากๆ เวลาที่ใช้ทดสอบ เป็นต้น จึงทำให้มีการคิดค้นวิธีการอื่นๆ ที่จะช่วยให้การวัดคุณภาพเสียงนั้นง่ายขึ้น เรามาดูวิธีการต่างๆ ที่ว่ากันต่อไปเลยนะครับ วิธีการแบบ Active Testingอย่างที่เราได้เกริ่นนำไปก่อนหน้านี้นะครับ คุณภาพของเสียงที่ได้จากการสื่อสารผ่านเครือข่ายนั้น จะวัดที่ความใกล้เคียงหรือเหมือนกับต้นฉบับที่เข้ามาสู่เครือข่าย ดังนั้น จึงได้มีการนำเอาแนวคิดนี้มาใช้ในการวัดคุณภาพเสียงของเครือข่ายกัน นั่นก็คือ ใช้การเปรียบเทียบกับต้นฉบับนั่นเอง มาตรฐานที่ใช้วิธีการนี้ ก็ได้แก่ Perception Speech Quality Measure (PSQM: ITU-T P.861), Perceptual Evaluation of Speech Quality (PESQ: ITU-T P.862), Perceptual Analysis Measurement System (British Telecom) เป็นต้น วิธีการน่ะหรือครับ ก็เริ่มจากการนำเอาออดิโอไฟล์ต้นฉบับ มาแบ่งออกเป็นบล็อกเล็กๆ ที่เหลื่อมกันอยู่ จากนั้นก็ทำการคำนวณค่า Fourier Transform Coefficient ของแต่ละบล็อกเก็บไว้ และเมื่อเสียงนั้นได้ผ่านเครือข่ายออกมาแล้ว ก็ทำวิธีเดียวกันเพื่อให้ได้ชุดค่าของ Fourier Transform Coefficient มาเพื่อทำการเปรียบเทียบ และทำการให้คะแนน ซึ่งถึงแม้ว่าคะแนนที่ได้จะไม่ตรงกับคะแนน MOS เสียทีเดียว แต่ก็มีความน่าเชื่อถือและเปรียบเทียบได้มาก โดยจะมีค่าของ Correlation สูงถึง 0.95 ทีเดียว (หากเป็นค่าเดียวกัน จะมีค่าสูงเท่ากับ 1) จึงนับว่าเป็นวิธีการที่น่าเชื่อถือมากทีเดียว อย่างไรก็ตาม วิธีการนี้ก็ยังมีข้อเสียใหญ่ๆ อยู่หลายข้อทีเดียว ข้อแรกก็คือ เนื่องจากเป็นการเปรียบเทียบกับไฟล์ออดิโออ้างอิง จึงจำเป็นที่จะต้องมีการสร้างไฟล์เสียงอ้างอิงนั้นแล้วส่งเข้าไปในเครือข่าย ซึ่งจะเป็นการเพิ่มโหลดหรือทราฟฟิกให้กับเครือข่ายเพิ่มขึ้น หากเราต้องการที่จะวัดคุณภาพเสียงของเครือข่ายนั้นๆ ข้อที่สองก็คือ การที่จะต้องวัดเปรียบเทียบไฟล์อ้างอิงที่จะต้องทำการส่งเข้าไปในเครือข่ายนั้น จะต้องมีการวัดทั้งที่ต้นทางและปลายทาง ซึ่งส่วนใหญ่จะอยู่กับคนละที่ จึงทำให้ลำบากต่อการติดตั้งอุปกรณ์วัดและการทำการวัดจริงๆ และยากที่จะทำการวัดนอกเครือข่ายของตนเองได้ จึงทำให้ขอบเขตการวัดค่อนข้างจำกัด ด้วยข้อเสียทั้งสองข้อนี้ จึงทำให้ไม่เป็นที่นิยมมากนัก ยกเว้นในกรณีของการทดสอบในห้องทดลองเป็นต้นวิธีการแบบ Passive Monitoringวิธีการแบบนี้จะตรงกันข้ามกับวิธีการแรก นั่นก็คือ ไม่มีการเปรียบเทียบแต่อย่างใด จึงทำให้คล่องตัวและสะดวกต่อการวัดคุณภาพเสียงมากขึ้น วิธีการที่ว่านี้ก็คือ มาตรฐาน ITU-T P.563 หรือ 3SQM (Single Sided Speech Quality Measure) วิธีนี้ จะเริ่มจากการที่นำเอาเสียงที่ผ่านเครือข่ายมาแล้วนั้น ผ่านกระบวนการ Pre-Processing ซึ่งได้แก่การทำ Filtering, ปรับระดับเสียง และแยกเสียง Voice กับ Non-Voice ออกจากกัน (Voice Activity Detection) เพื่อให้เหมาะสมกับการประมวลผลต่อไป จากนั้น ก็จะนำมาประมวลผลเพื่อแยกเอาค่าพารามิเตอร์ของเสียงและค่าความเพี้ยนต่างๆ ออกมา ซึ่งค่าความเพี้ยนต่างๆ นั้นก็ได้แก่

Unnatural Speech เช่นเสียงหุ่นยนต์ เสียงประหลาดๆ เช่นเสียงบี๊บ ที่ไม่ใช่เสียงที่จะพบได้ทั่วไป

Noise เสียงรบกวนต่างๆ ที่เข้ามา รวมทั้งเจ้า Background Noise

Interruptions, Mute ซึ่งเป็นเสียงที่หายไป เงียบ หรือการ clipping ของเสียงที่เกิดขึ้น เป็นต้น

เมื่อได้ค่าพารามิเตอร์ของเสียงและค่าความเพี้ยนต่างๆ ออกมาแล้ว ก็จะนำมาสร้างเป็นค่า MOS ที่มีตั้งแต่ 1 ถึง 5 ซึ่งมีค่า Correlation เท่ากับ 0.89 – 0.9 อาจจะไม่ดีเท่ากับวิธีที่แล้ว แต่ก็นับว่าใช้ได้ทีเดียว อีกทั้งสะดวกต่อการวัดมากกว่า และสามารถที่จะใช้วัดสัญญาณที่ได้จริงจากเครือข่ายได้ ไม่จำเป็นที่จะต้องไฟล์ออดิโออ้างอิงแต่อย่างไร ทำให้วิธีการนี้ค่อนข้างที่จะเหมาะสมกับการวัดคุณภาพเสียงได้ดีทีเดียว โดยเฉพาะกับเครือข่ายที่ใช้งานอยู่จริงนอกจากวิธีต่างๆ ที่ได้กล่าวมาแล้วนั้น ผู้ผลิตบางรายได้ค้นคิดวิธีต่างๆ ที่จะใช้วัดคุณภาพเสียงขึ้น ซึ่งถึงแม้ว่าจะไม่ดีเท่ากับวิธีที่กล่าวมา แต่ก็ถือว่าใช้งานได้ เช่น ได้มีการนำเอาวิธีการในการวางแผนเครือข่ายหรือ E-Model (ITU-T G.107) มาปรับแต่งเพื่อใช้ในการวัดคุณภาพเสียง และมีต้นทุนที่ต่ำกว่า เป็นต้น หากจะเรียงลำดับกันถึงความถูกต้องเชื่อถือได้ในการวัดคุณภาพของเสียงนั้น ก็คงต้องยกให้ MOS เป็นวิธีการที่ดีที่สุด รองลงมาก็คือ วิธี Active Testing เช่น PESQ จากนั้นก็คือ P.563 และที่ใช้ได้ก็คือวิธีต่างๆ ของผู้ผลิตที่แม้จะไม่เทียบเท่า แต่ก็จะได้วิธีที่ประหยัดเงินและพอที่จะใช้อ้างอิงได้ แต่ต้องอ้างอิงกับผู้ผลิตเดียวกันเท่านั้น ดังนั้นในความเห็นของผู้เขียน วิธี P.563 จึงน่าจะเหมาะสมที่สุดที่จะใช้ในการอ้างอิงเปรียบเทียบ เพราะสะดวกต่อการวัดและสามารถอ้างอิงได้เพราะเป็นมาตรฐานที่ชัดเจน แต่หากไม่ได้ต้องการที่จะใช้อ้างอิงกับเครือข่ายหรือมาตรฐานใดๆ มากนัก การใช้งาน E-model ก็ถือว่าใช้ได้พอสมควรทีเดียว และยังอาจจะเปรียบเทียบกับค่า MOS มาตรฐานได้ แม้จะไม่ถูกต้องเสียทีเดียว ครับ เป็นอย่างไรกันบ้างครับ มาถึงตรงนี้ ก็คงพอจะมีไอเดียในการวัดคุณภาพเสียงในการสื่อสารกันพอสมควรนะครับ หวังว่าคงจะให้ความรู้บ้างไม่มากก็น้อยนะครับ สำหรับวันนี้ สวัสดีครับ แหล่งที่มา : นิตยสาร Windows ITPro

Credit : http://www.tmi.or.th/index.php?option=com_content&view=article&id=293&catid=27:it-infrastructure&Itemid=49

TELECOM10 : คำศัพท์โทรคมนาคม

9.23.2558

MOS

ไม่มีความคิดเห็น:

แสดงความคิดเห็น