R

Tutorial de programación de R

Tutorial de programación de R
Quiere que sea un programador de R principiante a experto rápidamente? R es uno de los mejores lenguajes de programación para trabajar con estadísticas, matemáticas y ciencia de datos. Este tutorial te ayudará a aprender R y a construir tu primer modelo de aprendizaje automático. Empecemos.

Compilar y ejecutar R desde la línea de comandos

Las dos formas de ejecutar programas R son: un script R, que se usa ampliamente y es el más preferido y el segundo es R CMD BATCH, no es un comando de uso común. Podemos llamarlos directamente desde la línea de comandos o cualquier otro programador de trabajos.

Es concebible que pueda llamar a estos comandos desde un shell integrado en el IDE y, hoy en día, el IDE de RStudio viene con herramientas que mejoran o administran el script R y las funciones R CMD BATCH.

La función source () dentro de R es una buena alternativa al uso de la línea de comando. Esta función también puede llamar a un script, pero para usar esta función, debe estar dentro del entorno R.

Conjuntos de datos integrados del lenguaje R

Para enumerar los conjuntos de datos que están integrados con R, use el comando data (), luego busque lo que desea y use el nombre del conjunto de datos en la función data (). Como datos (nombre de la función).

Mostrar conjuntos de datos en R

El signo de interrogación (?) podría usarse para solicitar ayuda para conjuntos de datos.

Para verificar todo, use resumen ().

Plot () también es una función que se usa para trazar gráficos.

Creemos un script de prueba y ejecútelo. Crear p1.R y guárdelo en el directorio de inicio con el siguiente contenido:

Ejemplo de código:

 # Código simple de hola mundo en R print ("Hola mundo!") imprimir (" LinuxHint ") imprimir (5 + 6) 

Ejecutando Hello World

Marcos de datos R

Para almacenar datos en tablas, usamos una estructura en R llamada Marco de datos. Se utiliza para enumerar vectores de igual longitud. Por ejemplo, la siguiente variable nm es un marco de datos que contiene tres vectores x, y, z:

x = c (2, 3, 5) y = c ("aa", "bb", "cc") z = c (VERDADERO, FALSO, VERDADERO) # nm es un marco de datos nm = datos.marco (n, s, b) 

Hay un concepto llamado IncorporadoLos marcos de datos en R también. mtcars es uno de esos marcos de datos integrados en R, que usaremos como ejemplo, para nuestra mejor comprensión. Vea el código a continuación:

 > mtcars mpg cyl disp hp drat wt… Mazda RX4 21.0 6160 110 3.90 2.62… autobús RX4 Wag 21.0 6160 110 3.90 2.88… Datsun 710 22.8 4 108 93 3.85 2.32… 

marco de datos mtcars bulitin

El encabezado es la línea superior de la tabla que contiene los nombres de las columnas. Las filas de datos son donadas por cada línea horizontal; cada línea comienza con el nombre de la fila y luego sigue los datos reales. El miembro de datos de una fila se denomina celda.

Ingresaríamos las coordenadas de fila y columna en un solo operador '[]' para recuperar datos en una celda. Para separar las coordenadas, usamos una coma. El orden es imprescindible. La coordenada comienza con una fila, luego una coma y luego termina con la columna. Valor de celda de 2Dakota del Norte fila y 1S t la columna se da como:

 > mtcars [2, 2] [1] 6 

También podemos usar el nombre de fila y columna en lugar de coordenadas:

 > mtcars ["Bus RX4", "mpg"] [1] 6 

La función nrow se usa para encontrar el número de filas en el marco de datos.

 > nrow (mtcars) # número de filas de datos [1] 32 

La función ncol se usa para encontrar el número de columnas en un marco de datos.

 > ncol (mtcars) # número de columnas [1] 11 

Bucles de programación R

Bajo algunas condiciones, usamos bucles cuando queremos automatizar alguna parte del código o queremos repetir una secuencia de instrucciones.

Para bucle en R

Si queremos imprimir la información de estos años más de una vez.

 imprimir (pegar ("El año es", 2000)) "El año es 2000" imprimir (pegar ("El año es", 2001)) "El año es 2001" imprimir (pegar ("El año es", 2002) ) "El año es 2002" imprimir (pegar ("El año es", 2003)) "El año es 2003" imprimir (pegar ("El año es", 2004)) "El año es 2004" imprimir (pegar (" El año es ", 2005))" El año es 2005 " 

En lugar de repetir nuestra declaración una y otra vez si usamos por bucle será mucho más fácil para nosotros. Como esto:

 for (año en c (2000,2001,2002,2003,2004,2005)) print (paste ("El año es", año)) "El año es 2000" "El año es 2001" "El año es 2002 "" El año es 2003 "" El año es 2004 "" El año es 2005 " 

Mientras bucle en R

 while (expresión) declaración 

Si el resultado de la expresión es VERDADERO, se ingresa el cuerpo del bucle. Se realizan las declaraciones dentro del ciclo y el flujo regresa para evaluar la expresión nuevamente. El bucle se repetirá hasta que la expresión se evalúe como FALSE, en cuyo caso el bucle sale.

Ejemplo de bucle while:

 # i se inicializa inicialmente a 0 i = 0 mientras (i<5)  print (i) i=i+1  Output: 0 1 2 3 4 

En el bucle while anterior, la expresión es I<5que mide a VERDADERO ya que 0 es menor que 5. Por tanto, se ejecuta el cuerpo del bucle y I se emite y se incrementa. Es importante incrementar I dentro del bucle, por lo que de alguna manera cumplirá la condición en algún momento. En el siguiente ciclo, el valor de I es 1, y el bucle continúa. Se repetirá hasta I es igual a 5 cuando la condición 5<5 reached loop will give FALSE and the while loop will exit.

Funciones R

Para crear un función usamos la función directiva (). Específicamente, son objetos R de clase función.

F <- function()  ##some piece of instructions  

En particular, las funciones podrían pasarse a otras funciones como argumentos y las funciones podrían anidarse, para permitirle determinar una función dentro de otra función.

Las funciones opcionalmente pueden tener algunos argumentos con nombre que tienen valores predeterminados. Si no desea un valor predeterminado, puede establecer su valor en NULL.

Algunos datos sobre los argumentos de la función R:

# Definición de una función: f <- function (x, y = 1, z = 2, s= NULL)   

Crear un modelo de regresión logística con un conjunto de datos incorporado

La glm () La función se usa en R para ajustar la regresión logística. La función glm () es similar a lm () pero glm () tiene algunos parámetros adicionales. Su formato se ve así:

 glm (X ~ Z1 + Z2 + Z3, familia = binomio (enlace = "logit"), datos = mydata) 

X depende de los valores de Z1, Z2 y Z3. Lo que significa que Z1, Z2 y Z3 son variables independientes y X es la función dependiente. La función involucra una familia de parámetros adicional y tiene un valor binomial (enlace = "logit"), lo que significa que la función de enlace es logit y la distribución de probabilidad del modelo de regresión es binomial.

Supongamos que tenemos un ejemplo de estudiante en el que obtendrá la admisión sobre la base de dos resultados de exámenes. El conjunto de datos contiene los siguientes elementos:

Tutorial de Shadow of the Tomb Raider para Linux
Shadow of the Tomb Raider es la duodécima incorporación a la serie Tomb Raider, una franquicia de juegos de acción y aventuras creada por Eidos Montre...
Cómo impulsar FPS en Linux?
FPS significa Cuadros por segundo. La tarea de FPS es medir la velocidad de fotogramas en reproducciones de video o actuaciones de juegos. En palabras...
Los mejores juegos de Oculus App Lab
Si es propietario de un visor Oculus, debe estar informado sobre la descarga lateral. Sideloading es el proceso de instalación de contenido que no es ...