Releases: PyThaiNLP/pythainlp
PyThaiNLP 1.7 Alpha 1
PyThaiNLP 1.7 Alpha 1 เป็นเวชั่นทดสอบสำหรับนักพัฒนา ไม่แนะนำให้นำไปใช้งานจริง
มีอะไรใหม่ใน PyThaiNLP 1.7
สรุปประเด็นสำคัญ
- ยกเลิกการสนับสนุน Python 2.7 อย่างเป็นทางการ
- เพิ่ม ULMFit utility เข้ามาใน PyThaiNLP
- ปรับปรุงระบบตัดคำใหม่ ทั้ง newmm และ mm
- thai2vec v0.2
- sentiment analysis ตัวใหม่ทำงานด้วย Deep learning
- เพิ่ม thai2rom เป็น Thai Romanization ทำด้วย Deep learning ในระดับตัวอักษร
- Train Pos tag ใหม่เพิ่มเติมจากเดิม
การติดตั้ง
ใช้คำสั่ง pip install https://github.com/PyThaiNLP/pythainlp/archive/1.7a1.zip
แจ้งข้อผิดพลาดหรือเสนอแนะนำได้ที่ https://github.com/PyThaiNLP/pythainlp/issues
PyThaiNLP 1.6.0.7
- edit dropbox url for thai2vec
PyThaiNLP 1.6.0.6
- fixed #93
PyThaiNLP 1.6.0.5
- fix tcc rule 729d322
PyThaiNLP 1.6.0.4
- fix url thai2vec
PyThaiNLP 1.6
มีอะไรใหม่ใน PyThaiNLP 1.6
- ตัวตัดคำ newmm ถูกเขียนขึ้นใหม่โดยใช้หลัก Maximum Matching algorithm และ TCC เพื่อแก้ไขข้อผิดพลาดจากการตัดคำที่ไม่มีในฐานข้อมูลโดยคุณ @korakot และตัดคำได้รวดเร็วยิ่งขึ้น
- เพิ่ม cutkum (https://github.com/pucktada/cutkum) เข้ามาเป็นส่วนหนึ่งของระบบตัดคำ
- เพิ่ม syllable_tokenize ระบบตัดพยางค์ภาษาไทยโดยใช้ dict ในการตัดพยางค์
- เพิ่ม dict_word_tokenize สำหรับใช้เป็นฐานข้อมูลตัดคำได้ตามที่ต้องการ
- pythainlp.romanization โดยใช้ royin ถูกเขียนขึ้นใหม่
- pythainlp.sentiment ถูก Train ใหม่โดยใช้ตัวตัดคำ newmm ทำให้ได้ผลลัพธ์ที่แม่นยำขึ้นมากกว่าเดิม
- เพิ่ม pythainlp.word_vector.thai2vec โดยสามารถนำ https://github.com/cstorm125/thai2vec ของคุณ @cstorm125 ไปใช้งานได้
- เพิ่มระบบเก็บไฟล์ไว้ใน pythainlp-data สำหรับใช้เก็บข้อมูลต่าง ๆ ของ PyThaiNLP
- ติดตั้งได้สะดวกยิ่งขึ้นด้วยการเขียนโค้ดทดแทน pyicu ทำให้ไม่จำเป็นต้องติดตั้ง pyicu อีกต่อไป
เอกสารการใช้งาน https://github.com/PyThaiNLP/pythainlp/blob/pythainlp1.6/docs/pythainlp-1-6-thai.md
แล้วติดตั้งได้ด้วยคำสั่ง pip install -U pythainlp
PyThaiNLP 1.6 Beta 1
PyThaiNLP 1.6 Beta 1 รุ่นทดสอบสำหรับนักพัฒนาและบุคคลทั่วไป เป็นรุ่นที่ API นิ่งแล้ว
มีอะไรใหม่ใน PyThaiNLP 1.6
- ตัวตัดคำ newmm ถูกเขียนขึ้นใหม่โดยใช้หลัก Maximum Matching algorithm และ TCC เพื่อแก้ไขข้อผิดพลาดจากการตัดคำที่ไม่มีในฐานข้อมูลโดยคุณ @korakot และตัดคำได้รวดเร็วยิ่งขึ้น
- เพิ่ม cutkum (https://github.com/pucktada/cutkum) เข้ามาเป็นส่วนหนึ่งของระบบตัดคำ
- เพิ่ม syllable_tokenize ระบบตัดพยางค์ภาษาไทยโดยใช้ dict ในการตัดพยางค์
- เพิ่ม dict_word_tokenize สำหรับใช้เป็นฐานข้อมูลตัดคำได้ตามที่ต้องการ
- pythainlp.romanization โดยใช้ royin ถูกเขียนขึ้นใหม่
- pythainlp.sentiment ถูก Train ใหม่โดยใช้ตัวตัดคำ newmm ทำให้ได้ผลลัพธ์ที่แม่นยำขึ้นมากกว่าเดิม
- เพิ่ม pythainlp.word_vector.thai2vec โดยสามารถนำ https://github.com/cstorm125/thai2vec ของคุณ @cstorm125 ไปใช้งานได้
- เพิ่มระบบเก็บไฟล์ไว้ใน pythainlp-data สำหรับใช้เก็บข้อมูลต่าง ๆ ของ PyThaiNLP
- ติดตั้งได้สะดวกยิ่งขึ้นด้วยการเขียนโค้ดทดแทน pyicu ทำให้ไม่จำเป็นต้องติดตั้ง pyicu อีกต่อไป
เอกสารการใช้งาน https://github.com/PyThaiNLP/pythainlp/blob/dev/docs/pythainlp-1-6-thai.md (กำลังปรับปรุง)
สามารถทดลองใช้งานได้ โดยลบ PyThaiNLP เวชั่นก่อนทิ้งด้วยคำสั่ง pip uninstall pythainlp
แล้วติดตั้งได้ด้วยคำสั่ง pip install https://github.com/PyThaiNLP/pythainlp/archive/1.6-beta-1.zip
หากท่านพบ Bug สามารถแจ้งได้ที่ https://www.facebook.com/pythainlp/ หรือหน้า https://github.com/PyThaiNLP/pythainlp/issues
ขอบคุณท่านที่ใช้ PyThaiNLP :)
ทีมนักพัฒนา PyThaiNLP
PyThaiNLP 1.6 Alpha 2
มีอะไรใหม่ ?
- ปรับปรุงความเร็วในการตัดคำด้วย newmm ด้วยการเขียนโค้ดตัดคำใหม่โดยคุณ @korakot และปรับปรุงประสิทธิภาพในการตัดคำภาษาไทย #65
- เพิ่ม pythainlp.word_vector.thai2vec โดยรวม thaivec ของคุณ @cstorm125 เข้ามาใน PyThaiNLP
ก่อนทดลองใช้งานให้ทำการลบ PyThaiNLP เวชั่นเก่าทิ้งด้วยคำสั่ง pip uninstall pythainlp
ติดตั้งได้ด้วยคำสั่ง pip install https://github.com/PyThaiNLP/pythainlp/archive/1.6a2.zip
PyThaiNLP 1.6 Alpha 1
PyThaiNLP 1.6 รุ่น alpha 1 (รุ่นสำหรับนักพัฒนาเท่านั้น)
มีอะไรใหม่
- เพิ่มความเร็วในการตัดคำด้วยการ build model Trie ไว้
- เพิ่มตัวตัดพยางค์ภาษาไทย
- เพิ่ม API ให้ผู้ใช้งานโมดูลสามารถใช้พจนานุกรมของตัวเองในการตัดคำได้
- เปลี่ยนจากตัวตัดคำ icu ค่าเริ่มต้นไปเป็น newmm
- แก้ไขการตัดคำผิดโดยใช้ TCC (Thai Character Clusters) เข้ามาช่วยตัดคำด้วย
ทดลองได้ด้วยคำสั่ง
pip install https://github.com/PyThaiNLP/pythainlp/archive/1.6a1.zip
PyThaiNLP 1.5.2
- fix stopwords