PyThaiNLP 2.2.0
English
Hello World. Today, we're happy to announce the availability of PyThaiNLP. It has been four years since PyThaiNLP's the first release. Thank you very much for supporting PyThaiNLP.
Summary – Release Highlights
New Features
Tokenizer
- Fix longest engine, last character is now consumed
- Add CRFCut sentence segmentation
Transliteration
- Add Thai Grapheme-to-Phoneme (Thai G2P) deep learning sequence-to-sequence model
Normalization
- Add more normalize functions, like remove zero-width characters, remove duplicate spaces, etc.
Utilities
- Add thaiword_to_date() and thaiword_to_time()
- Fix countthai() to handle a case where the text has only numbers and symbols
Command line
- Update command and sub-command syntax - see command line docs
Others
- Code improvement: Move non-init code out of init.py files, etc.
- Remove dependency: Unigram POS tagger no longer need NLTK module
Installation
You can install or upgrade using pip install -U pythainlp
Change log: #330
Documentation: https://www.thainlp.org/pythainlp/docs/2.2/
Tutorials: https://thainlp.org/pythainlp/tutorials/
GitHub: https://github.com/PyThaiNLP/pythainlp
We build Thai NLP
PyThaiNLP Team
ภาษาไทย
สวัสดีชาวโลก วันนี้ 24 มิถุนายน 2563 พวกเราได้ปล่อย PyThaiNLP 2.2 ตอนนี้ PyThaiNLP อายุครบ 4 ปี ขอบคุณที่ใช้ PyThaiNLP :)
สรุป – สิ่งที่สำคัญ
คุณลักษณะใหม่
ตัวตัดข้อความ
- แก้ไขตัวตัดคำ longest
- เพิ่มตัวตัดประโยค CRFCut
ถอดเสียง
- เพิ่มการถอดเสียงภาษาไทยเป็น IPA ด้วย Thai Grapheme-to-Phoneme (Thai G2P)
Normalization
- เพิ่มเติมความสามารถให้กับฟังก์ชัน normalize เช่น ลบช่องว่างซ้ำกัน เป็นต้น
เครื่องมือ
- เพิ่ม thaiword_to_date() และ thaiword_to_time()
- ปรับปรุง countthai()
Command line
- ปรับปรุงคำสั่ง command และไวยากรณ์ sub-command - ดูเพิ่มเติมได้ที่ command line docs
อื่น ๆ
- ปรับปรุงโค้ด: ย้ายโค้ดออกจากไฟล์ init.py เป็นต้น
- ลดความต้องการไลบรารีภายนอก: Unigram POS tagger สามารถทำงานได้โดยไม่ต้องการ NLTK
การติดตั้ง
สามารถติดตั้งหรือปรับรุ่นได้ด้วยคำสั่ง pip install -U pythainlp
Change log: #330
Documentation: https://www.thainlp.org/pythainlp/docs/2.2/
Tutorials https://thainlp.org/pythainlp/tutorials/
GitHub: https://github.com/PyThaiNLP/pythainlp
พวกเราสร้าง Thai NLP
ทีม PyThaiNLP