Skip to content

PyThaiNLP 2.2.0

Compare
Choose a tag to compare
@wannaphong wannaphong released this 24 Jun 14:07
980d104

English

Hello World. Today, we're happy to announce the availability of PyThaiNLP. It has been four years since PyThaiNLP's the first release. Thank you very much for supporting PyThaiNLP.

Summary – Release Highlights

New Features

Tokenizer

  • Fix longest engine, last character is now consumed
  • Add CRFCut sentence segmentation

Transliteration

  • Add Thai Grapheme-to-Phoneme (Thai G2P) deep learning sequence-to-sequence model

Normalization

  • Add more normalize functions, like remove zero-width characters, remove duplicate spaces, etc.

Utilities

  • Add thaiword_to_date() and thaiword_to_time()
  • Fix countthai() to handle a case where the text has only numbers and symbols

Command line

Others

  • Code improvement: Move non-init code out of init.py files, etc.
  • Remove dependency: Unigram POS tagger no longer need NLTK module

Installation

You can install or upgrade using pip install -U pythainlp

Change log: #330

Documentation: https://www.thainlp.org/pythainlp/docs/2.2/

Tutorials: https://thainlp.org/pythainlp/tutorials/

GitHub: https://github.com/PyThaiNLP/pythainlp

We build Thai NLP

PyThaiNLP Team

ภาษาไทย

สวัสดีชาวโลก วันนี้ 24 มิถุนายน 2563 พวกเราได้ปล่อย PyThaiNLP 2.2 ตอนนี้ PyThaiNLP อายุครบ 4 ปี ขอบคุณที่ใช้ PyThaiNLP :)

สรุป – สิ่งที่สำคัญ

คุณลักษณะใหม่

ตัวตัดข้อความ

  • แก้ไขตัวตัดคำ longest
  • เพิ่มตัวตัดประโยค CRFCut

ถอดเสียง

  • เพิ่มการถอดเสียงภาษาไทยเป็น IPA ด้วย Thai Grapheme-to-Phoneme (Thai G2P)

Normalization

  • เพิ่มเติมความสามารถให้กับฟังก์ชัน normalize เช่น ลบช่องว่างซ้ำกัน เป็นต้น

เครื่องมือ

  • เพิ่ม thaiword_to_date() และ thaiword_to_time()
  • ปรับปรุง countthai()

Command line

  • ปรับปรุงคำสั่ง command และไวยากรณ์ sub-command - ดูเพิ่มเติมได้ที่ command line docs

อื่น ๆ

  • ปรับปรุงโค้ด: ย้ายโค้ดออกจากไฟล์ init.py เป็นต้น
  • ลดความต้องการไลบรารีภายนอก: Unigram POS tagger สามารถทำงานได้โดยไม่ต้องการ NLTK

การติดตั้ง

สามารถติดตั้งหรือปรับรุ่นได้ด้วยคำสั่ง pip install -U pythainlp

Change log: #330

Documentation: https://www.thainlp.org/pythainlp/docs/2.2/

Tutorials https://thainlp.org/pythainlp/tutorials/

GitHub: https://github.com/PyThaiNLP/pythainlp

พวกเราสร้าง Thai NLP

ทีม PyThaiNLP