В процессе обучения курсу Natural Language Processing в рекомендуемых материалах нашлась небольшая статейка о том как работать с текстом в Unix. Называется это творение Unix for Poets. Написана она в секретных лабораториях Стенфорда.
Содержание:
Exercises to be addressed
1. Count words in a text
2. Sort a list of words in various ways
3. Extract useful info from a dictionary
4. Compute ngram statistics
5. Make a Concordance
- ascii order
- dictionary order
- ‘‘rhyming’’ order
3. Extract useful info from a dictionary
4. Compute ngram statistics
5. Make a Concordance
Комментариев нет:
Отправить комментарий