Corretor ortográfico em Python
-
Verificador ortográfico com a biblioteca
autocorrectem Python -
Verificador ortográfico com a biblioteca
pyspellcheckerem Python -
Verificador ortográfico com a biblioteca
textblobem Python
Este tutorial discutirá os métodos que você pode usar para criar um corretor ortográfico em Python.
Verificador ortográfico com a biblioteca autocorrect em Python
O autocorrect é uma biblioteca externa que pode ser usada para desenvolver um corretor ortográfico em Python. Por se tratar de uma biblioteca externa, devemos baixá-la e instalá-la antes de usá-la em nosso código. O comando para instalar o módulo autocorreção é fornecido abaixo.
pip install autocorrect
Podemos usar a classe Speller dentro da biblioteca autocorrect e especificar a linguagem no construtor. O código de exemplo a seguir nos mostra como podemos criar um corretor ortográfico com o módulo autocorrect.
from autocorrect import Speller
spell = Speller(lang="en")
misspelled = ["scisors", "chemp", "celender", "berthday"]
for word in misspelled:
print("original word: " + word)
print("corrected word: " + spell(word))
Produção:
original word: scisors
corrected word: scissors
original word: chemp
corrected word: champ
original word: celender
corrected word: calendar
original word: berthday
corrected word: birthday
No código acima, desenvolvemos um corretor ortográfico com a classe Speller dentro da biblioteca autocorrect. Criamos uma instância spell da classe Speller e especificamos o idioma inglês dentro do construtor. Passamos a palavra com erros ortográficos dentro do objeto, como fazemos com uma função normal, e ele retornou a palavra corrigida.
Verificador ortográfico com a biblioteca pyspellchecker em Python
O pyspellchecker é outra biblioteca externa que pode ser usada no lugar da biblioteca autocorrect para desenvolver um verificador ortográfico em Python.
Uma vez que também é uma biblioteca externa, temos que fazer o download e instalá-la também para usá-la em nosso código. O comando para instalar a biblioteca pyspellchecker é fornecido abaixo.
pip install pyspellchecker
Podemos usar a classe SpellChecker dentro da biblioteca pyspellchecker para prever a palavra correta. A função correction() dentro da classe SpellChecker pega a palavra incorreta como um argumento de entrada e retorna a palavra corrigida como uma string.
O programa a seguir nos mostra como podemos criar um corretor ortográfico com a biblioteca pyspellchecker.
from spellchecker import SpellChecker
spell = SpellChecker()
misspelled = ["scisors", "chemp", "celender", "berthday"]
for word in misspelled:
print("original word: " + word)
print("corrected word: " + spell.correction(word))
Produção:
original word: scisors
corrected word: scissors
original word: chemp
corrected word: cheap
original word: celender
corrected word: calender
original word: berthday
corrected word: birthday
Desenvolvemos um verificador ortográfico com a classe SpellChecker dentro do módulo spellchecker no código acima. Criamos uma instância spell da classe SpellChecker e o idioma padrão é o inglês. Passamos a palavra incorreta dentro da função correction() do objeto spell, retornando a palavra corrigida.
Verificador ortográfico com a biblioteca textblob em Python
Para desenvolver um verificador ortográfico em Python, também podemos usar a biblioteca textblob. O textblob é usado para processar dados textuais. É uma biblioteca externa e precisamos instalá-la com o seguinte comando.
pip install textblob
A função correct() dentro da biblioteca textblob retorna a correção para uma palavra incorreta. O programa de exemplo a seguir nos mostra como criar um programa verificador ortográfico usando a biblioteca textblob do Python.
from textblob import TextBlob
misspelled = ["scisors", "chemp", "celender", "berthday"]
for word in misspelled:
print("original word: " + word)
spell = TextBlob(word)
print("corrected word: " + str(spell.correct()))
Produção:
original word: scisors
corrected word: scissors
original word: chemp
corrected word: cheap
original word: celender
corrected word: slender
original word: berthday
corrected word: birthday
No código acima, desenvolvemos um corretor ortográfico com a classe TextBlob dentro da biblioteca textblob. Criamos uma instância spell da classe TextBlob e passamos a palavra dentro do construtor; o idioma padrão é o inglês. Em seguida, usamos a função correct() para exibir a grafia adequada para aquela palavra em particular.
Maisam is a highly skilled and motivated Data Scientist. He has over 4 years of experience with Python programming language. He loves solving complex problems and sharing his results on the internet.
LinkedIn