Comandos básicos de Linux/Shell Terminal para Data Science

March 10, 2023

Muchas veces, en nuestro trabajo cotidiano resulta esencial recurrir a la Terminal para poder realizar consultas o acciones rápidas sin la necesidad de tener que utilizar Python en los comienzos.

Para eso existen comandos en Terminal de Mac o Linux que nos ayudarán a trabajar de forma eficiente y rápida cada acceso a la información.

Los comandos básicos de Shell Terminal para Data Science

  • ls: es un comando utilizado para mostrar una serie de listas de documentos y carpetas en una ubicación especifica del disco.
  • pwd: si estamos perdidos, siempre es bueno saber en que carpeta exacta estamos trabajando.
  • cd: historico comando para trabajar a traves de carpetas o directorios.
  • wget: te permite descargarte todo tipo de información. En ciencia de datos te permite descargarte información sobre distintos repositorios de github.
  • cat: crear, concatenar y visualizar archivos es su función principal.
  • wc: es un contador de palabras. Ideal cuando estamos trabajando documentos en string. Nos saca de apuro en el momento para luego proceder a trabajar con NLP.
  • head: muy al estilo Python, nos muestra las primeras filas del archivo en cuestion. Tenemos que especificar el numero.
  • find: es el comando para encontrar diferentes archivos en carpetas
  • grep: es una herramienta muy util para el filtrado de información a traves de diferentes patrones que le adjuntemos al comando.
  • history: si nos olvidamos cual fue el comando que ingresamos días atrás, history nos ayudará y traerá a escenario los últimos comandos planteados.
  • zip: ideal para la compresión de diferentes archivos en una carpeta
  • unzip: ideal para descomprimir un archivo zip.y poder trabajar el mismo de forma individualizada.
  • man: simple editor de texto que te permite crear un documento. No intentes generar código ya que vas a tener series dificultades con la indentanciones

Hay muchísimos más inclusive podes usar combinaciones de los mismos para consultas aún más complejas pero estoy seguro que este listado te va a sacar del apuro en muchas ocasiones dónde la eficiencia se evalúa por el tiempo.


Rodolfo Pardo analista de datos

Esta nota fue escrita por Rodolfo Pardo Analista de datos en Python