FAQ

English

Frequently Asked Questions about PyThaiNLP

Q: What is PyThaiNLP?

A: PyThaiNLP (Py-Thai-N-L-P) is a Python library for Thai natural language processing. The library provides functions like word tokenization, part-of-speech tagging, transliteration, soundex generation, and spell checking.

Q: What license does PyThaiNLP use?

A: PyThaiNLP code uses Apache Software License 2.0. Corpus data created by PyThaiNLP project use Creative Commons Zero 1.0 Universal Public Domain Dedication License (CC0). For other corpus that may included with PyThaiNLP distribution, please refer to Corpus License.

Q: How can I contribute to PyThaiNLP development?

A: Contributing to PyThaiNLP

Q: What is newmm tokenization?

A: https://github.com/PyThaiNLP/pythainlp/wiki/newmm-tokenization

Q: How to install PyThaiNLP

A: You can read installation.

Q: How to set the environment variables of each executor node in a distributed environment?

A: https://github.com/PyThaiNLP/pythainlp/issues/475

ภาษาไทย

คำถามที่พบบ่อยเกี่ยวกับ PyThaiNLP

Q: PyThaiNLP คืออะไร มีลิขสิทธิ์หรือค่าใช้จ่ายในการใช้ไหม

A: PyThaiNLP เป็นโครงการพัฒนาวงการประมวลผลภาษาไทย โดยมีโมดูล PyThaiNLP เป็นโครงการซอฟต์แวร์หลักสำหรับงานประมวลผลภาษาไทยด้วยภาษาไพทอน โดยสัญญาอนุญาตของรหัสใน PyThaiNLP เป็น Apache License 2.0 สามารถนำไปใช้งานทั้งส่วนตัวและเพื่อการค้าได้โดยไม่มีค่าใช้จ่าย สัญญาอนุญาตของชุดข้อมูล (dataset) ที่สร้างโดยโครงการ PyThaiNLP ใช้สัญญาอนุญาต Creative Commons Zero 1.0 Universal Public Domain Dedication License (CC0) ส่วนสัญญาอนุญาตของชุดข้อมูลอื่นๆ ที่โครงการเผยแพร่ต่อ เป็นตามที่ระบุไว้ในชุดข้อมูลนั้นๆ

Q: PyThaiNLP มีความเป็นมาอย่างไร

A: ดูรายละเอียดได้ที่ History

Q: จะช่วยพัฒนา PyThaiNLP ได้อย่างไร

A: ดูแนวทางการช่วยพัฒนาที่ Contributing to PyThaiNLP

Q: ตัวตัดคำ newmm คืออะไร?

A: https://github.com/PyThaiNLP/pythainlp/wiki/newmm-tokenization

Q: ติดตั้ง PyThaiNLP ได้อย่างไร?

A: คุณสามารถอ่านได้ที่ installation.

Q: มีวิธีการตั้งค่า environment variables สำหรับทุกโหนดใน distributed environment อย่างไร?

A: https://github.com/PyThaiNLP/pythainlp/issues/475