Ubuntu

Empezando con Rstudio en Ubuntu Linux

Empezando con Rstudio en Ubuntu Linux
Este tutorial ilustrará cómo instalar Rstudio en Ubuntu 20.04.

Rstudio proporciona un entorno de desarrollo integrado para manejar el lenguaje de programación libre "R", que está disponible bajo la licencia de GNU. Rstudio es un entorno informático ideal para generar visualizaciones estadísticas detalladas y, como tal, es utilizado por estadísticos de todo el mundo.

RStudio también está disponible como un programa de software y como una aplicación de servidor, utilizado por una variedad de diferentes distribuciones de Linux y para Windows y macOS.

Descargar el lenguaje de programación R (requisitos previos)

La aplicación de escritorio Rstudio necesita el lenguaje de programación R para funcionar en distribuciones de Linux. Es necesario descargar una versión R que sea compatible con su sistema operativo Linux. Puedes descargarlo usando un repositorio de software.

1- Descarga de R con el navegador web

Si no puede obtener R del centro de software, significa que el repositorio debe actualizarse primero. Puede omitir todo eso y descargarlo de la web escribiendo este enlace:

https: // cran.estudio.com

En el cuadro de búsqueda de su navegador web. Su página de inicio debe parecerse a la siguiente captura de pantalla:

2- Descarga de R desde la terminal de Linux

Encienda la terminal CLI, escriba el comando a continuación y presione enter:

Luego, ejecute una actualización con los siguientes comandos:

$ sudo apt-get update

Este comando buscará las actualizaciones de R y adquirirá todos los archivos relevantes del repositorio principal de Ubuntu.

Luego emita el siguiente comando para instalar R:

El comando anterior recorre la lista de paquetes, revelando cuánto espacio en disco se llenará, luego solicita confirmación. Presione la tecla 'Y' en su teclado para continuar con la instalación.

Lo más probable es que la salida confirme la instalación.

Puede buscarlo en el cuadro de búsqueda como se ilustra a continuación:

Instalación de Rstudio en Ubuntu 20.04 con terminal de mando

Con el lenguaje de programación del host instalado, ahora podemos proceder a instalar Rstudio. Para demostrar la instalación, usaremos el terminal de línea de comandos.

Encienda la terminal y emita lo siguiente

$ sudo apt-get install gdebi-core

Se le pedirá que ingrese la contraseña de root. Una vez que ingrese la contraseña, comenzará la instalación del paquete

$ wget https: // descargar1.rstudio.org / desktop / bionic / amd64 / rstudio-1.3.1093-amd64.debutante

El paquete en línea de Rstudio ya se ha conectado y se está transfiriendo a su disco duro.

Se le pedirá que ingrese la contraseña de root nuevamente. Ingrese la contraseña para que se lea y cargue la lista de paquetes.

El instalado le pedirá permiso para continuar, presione la tecla y en su teclado.

La salida verificará la instalación, como se muestra a continuación.

Empezando con RStudio:

Para iniciar RStudio, diríjase al cuadro de búsqueda y busque Rstudio. Lo verá dentro de una de las listas como se muestra a continuación:

Haga clic en el icono de Rstudio para iniciarlo.

Investigar conjuntos de datos con RStudio

Con Rstudio, puede visualizar cualquier dato en forma de gráficos, tablas y tablas.

Para comprender cómo se representan visualmente los datos en Rstudio, tomemos la muestra de población del censo de 2010 para cada código postal como ejemplo.

El proceso de análisis de datos se puede reducir vagamente a los siguientes cuatro pasos:

1-Importar datos brutos

Puede importar los datos sin procesar directamente desde la web a Rstudio haciéndolo sistemáticamente en la ventana de la consola con el siguiente comando:

$ cpd <- read.csv(url("https://data.lacity.org/api/views/nxs9-385f/rows.csv?accessType=DOWNLOAD")

Con el comando ejecutado, Rstudio obtendrá los datos como un archivo csv de la web, y los contenidos serán asignados a la variable cpd.

Otra forma de importar datos a Rstudio es descargar manualmente el conjunto de datos a su disco duro y luego abrir el contenido con la función de importación de datos de Rstudio.

Dirígete a la opción de importar conjunto de datos en la pestaña Entorno y selecciona el archivo del conjunto de datos para cargar. Haga clic en Aceptar y se le mostrará el cuadro de diálogo sobre el conjunto de datos. Aquí es donde especificará los parámetros, así como los nombres y decimales. Cuando haya terminado, simplemente haga clic en importar, y el conjunto de datos se agregará al Rstudio, y se le asignará una variable a su nombre.

Para ver qué conjuntos de datos están en uso, emita el siguiente comando con la variable atribuida a un conjunto de datos:

$ Ver (cpd)

2 -Manipulación de datos

Ahora que ha importado el conjunto de datos, hay muchas cosas que puede hacer para transformar estos datos. Los datos se manipulan mediante funciones de transformación. Suponga que desea recorrer una determinada matriz dentro del conjunto de datos. Si tuviéramos que ir a la columna de población total en nuestro conjunto de datos, ingresaríamos el siguiente comando:

$ cpd $ Población total

Los datos también se pueden recuperar en forma de vector:

$ cpd [1,3]

La función de subconjunto en Rstudio nos permite consultar el conjunto de datos. Digamos que necesitamos resaltar las filas donde la proporción de hombres y mujeres es positiva. Para seleccionar esas filas, debe emitir el siguiente comando:

$ a <- subset(cpd , Total Males > Total de mujeres)

En el comando anterior, el primer parámetro que asignamos tenía que ser la variable atribuida al conjunto de datos al que aplicamos la función. La condición booleana se considera como el segundo parámetro. Además, la condición booleana debe evaluarse para cada fila. Sirve como factor decisivo en cuanto a si una fila debe ser parte del resultado.

3 -Uso de las funciones promedio en el conjunto de datos

Rstudio tiene funciones específicas para calcular promedios en el conjunto de datos:

$ mean (cpd $ Total hombres) - calcula el promedio simple
$ mediana (cpd $ Total de mujeres): da la mediana de una columna
$ cuantil (cpd $ población total): da el cuantil de una columna
$ var (cpd $ Total de hombres): calcula la varianza de una columna
$ sd (cpd $ Total de mujeres): da una desviación estándar

Para obtener el informe resumido sobre el conjunto de datos, también puede ejecutar cualquiera de estas funciones en todo el conjunto de datos.

$ resumen (cpd)

4 -Creación de un gráfico para el conjunto de datos

Si va a trabajar con Rstudio a menudo, encontrará su herramienta de visualización muy ingeniosa. Puede crear un gráfico a partir de cualquier conjunto de datos importado con el gráfico y otras funciones de visualización en Rstudio.

Para generar un diagrama de dispersión para el conjunto de datos, debe emitir el siguiente comando:

$ plot (x = s $ Total de hombres, y = s $ Total de mujeres, tipo = 'p')

Ahora, analicemos los parámetros involucrados aquí. En cada parámetro, s se refiere al subconjunto del conjunto de datos original, y al agregar "p", estás indicando que quieres que se grafique la salida.

También puede representar su conjunto de datos en forma de histograma:

$ hist (cpd $ Total de hogares)

De manera similar, para obtener un gráfico de barras del conjunto de datos importado:

$ cuenta <- table(cpd$Total Population)
$ barplot (count, main = "Distribución de la población total",
$ xlab = "Número de población total")

Gestión de datos en series de tiempo espaciadas de forma desigual

Para administrar datos con series de tiempo espaciadas de manera desigual, debe integrar el paquete zoo con Rstudio. Para obtener el paquete zoo, vaya a la esquina inferior derecha de la pantalla en Rstudio y al componente del paquete. El paquete zoo convierte los datos de series temporales irregulares en objetos de zoo. Los argumentos insertados para crear objetos de zoológico son los datos, que vienen primero, seguidos por el valor para ordenar por.

Los objetos del zoológico brindan soporte para la facilidad de uso. Todo lo que tiene que hacer es escribir "trama", y se le mostrarán todos los métodos de trama que puede utilizar con ese paquete zoo.

Si se siente confundido acerca de lo que ofrece una determinada función de Rstudio, ingrese el nombre de esa función y siga con "?"Para ver el mensaje en el menú de ayuda. Además, presionar ctrl + espacio después del nombre de una función produce la ventana de autocompletar.

Terminando

Este tutorial ha ilustrado cómo puede configurar Rstudio en Ubuntu 20.04 y cubrió los conceptos básicos de representación y manipulación estadísticas con Rstudio. Si desea utilizar mejor Rstudio, familiarizarse con los conceptos básicos de la programación en R debería ser un buen primer paso. Rstudio es una herramienta poderosa y tiene aplicaciones en muchas industrias en todo el mundo: inteligencia artificial y minería de datos, por nombrar algunas.

Conocer el meollo de la programación en R es una curva de aprendizaje, pero vale la pena el esfuerzo.

Herramientas útiles para jugadores de Linux
Si le gusta jugar juegos en Linux, es probable que haya utilizado aplicaciones y utilidades como Wine, Lutris y OBS Studio para mejorar la experiencia...
Juegos HD remasterizados para Linux que nunca tuvieron un lanzamiento de Linux antes
Muchos desarrolladores y editores de juegos están creando una remasterización HD de juegos antiguos para extender la vida útil de la franquicia, por f...
Cómo usar AutoKey para automatizar juegos de Linux
AutoKey es una utilidad de automatización de escritorio para Linux y X11, programada en Python 3, GTK y Qt. Usando su funcionalidad de scripting y MAC...