Cómo eliminar palabras vacías en Python sin Nltk – Resuelto

Cómo eliminar palabras vacías en Python sin Nltk – Resuelto

En el procesamiento de lenguaje natural, a menudo es útil eliminar palabras vacías o stop words que no aportan significado al texto. Aunque la librería NLTK es muy utilizada para esta tarea, también es posible lograrlo sin utilizarla. A continuación, te mostraré cómo hacerlo en Python.

Eliminar palabras vacías con Python

Para eliminar palabras vacías en Python, puedes crear una lista de palabras vacías comunes y luego filtrarlas del texto. A continuación te muestro un ejemplo sencillo de cómo hacerlo:

# Definir una lista de palabras vacías

stop_words = ["a", "an", "the", "in", "on", "at", "for", "to", "and", "or"]

# Definir una función para eliminar palabras vacías

def remove_stop_words(text):

words = text.split()

filtered_words = [word for word in words if word.lower() not in stop_words]

return ' '.join(filtered_words)

# Ejemplo de uso

text = "This is a sample text to remove stop words from"

filtered_text = remove_stop_words(text)

print(filtered_text)

En este ejemplo, definimos una lista de palabras vacías en la variable stop_words y luego creamos una función remove_stop_words que recibe un texto y retorna el texto sin las palabras vacías. Luego, probamos la función con un ejemplo de texto y mostramos el resultado.

¡Y listo! Con este sencillo código en Python, puedes eliminar palabras vacías de un texto sin necesidad de utilizar la librería NLTK. Espero que este artículo te haya sido útil. ¡Happy coding!

Rodrigo Olivares
Rodrigo Olivares

Rodrigo Olivares es un Ingeniero en Informática y estratega web que comparte en su canal de YouTube y en sus sitios web personales mas de 15 años de experiencia trabajando en diseño de sitios web, SEO, monetización e Inteligencia Artificial (IA)

Artículos: 554