Spracovanie prirodzeného jazyka (NLP) je špecializovaná oblasť na analýzu a generovanie ľudských jazykov. Ľudské jazyky, právom nazývané prirodzený jazyk, sú veľmi citlivé na kontext a často nejednoznačné, aby vytvorili odlišný význam. (Pamätajte si na vtip, kde manželka žiada manžela, aby dostal kartón mlieka, a ak majú vajcia, tak šesť, takže dostane šesť kartónov mlieka, pretože mali vajcia.) NLP poskytuje schopnosť porozumieť prirodzenému jazykovému vstupu a vytvárať prirodzené jazykový výstup primerane.
Počítačová lingvistika (CL) je širšou oblasťou jazykového porozumenia a modelovania. NLP je podmnožinou CL, ktorá sa zaoberá inžinierskymi aspektmi porozumenia a generovania jazyka. NLP je interdisciplinárna doména, ktorá sa dotýka viacerých oblastí vrátane umelej inteligencie (AI), strojového učenia (ML), hlbokého učenia (DL), matematiky a štatistiky.
Niektoré z aplikácií, ktoré môžete vytvoriť pomocou NLP, zahŕňajú:
- Tokenizujte do viet a slov
- Stopwords
- Kolokácie
- Identifikácia častí reči
- Stemming a lemmatizácia
- Corpus
Stavebné bloky NLP
Rovnako ako mrakodrap sa stavia tehla po tehli, môžete vytvárať veľké aplikácie, ako sú tie vyššie, pomocou základných a základných stavebných blokov NLP.
K dispozícii je niekoľko open source NLP knižníc, ako napríklad Stanford CoreNLP, spaCy a Genism v Pythone, Apache OpenNLP a GateNLP v Jave a ďalších jazykoch.
Na demonštráciu funkcií stavebných blokov NLP použijem Python a jeho primárnu knižnicu NLP, Natural Language Toolkit (NLTK). NLTK bola vytvorená na University of Pennsylvania. Je to široko používaný a pohodlný východiskový bod pre vstup do NLP. Keď sa naučíte jeho koncepty, môžete preskúmať ďalšie knižnice a vytvoriť si svoje aplikácie mrakodrapu NLP.
Základné stavebné bloky uvedené v tomto článku sú:
opensource.com
Precvičte si analýzu textu v spracovaní prirodzeného jazyka (NLP) v jazyku Python
Spracovanie prirodzeného jazyka (NLP) je špecializovaná oblasť na analýzu a generovanie ľudských jazykov. Ľudské jazyky, právom nazývané prirodzený jazyk, sú veľmi citlivé na kontext a často nejednoznačné, aby vytvorili odlišný význam. (Pamätajte si na vtip, v ktorom manželka žiada manžela, aby „doniesol kartón mlieka, a ak majú vajcia, dajte šesť“, takže dostane šesť kartónov mlieka, pretože mali vajcia.) NLP poskytuje schopnosť porozumieť zadávaniu prirodzeného jazyka a vhodne produkovať prirodzený jazykový výstup.>