“¿Investigación científica libre? El segundo adjetivo es redundante”.
— Ayn Rand
La colaboración en equipo es fundamental para el éxito en cualquier proyecto, y esto es especialmente cierto en el ámbito de la investigación y el análisis de datos. Los equipos de investigación que colaboran de manera efectiva pueden lograr una mayor eficiencia y productividad, así como una mejor calidad de los resultados. En este sentido, Github es una especie de google drive pensado para la investigación reproducible, en donde cada proyecto es un repositorio. La mayoría de los investigadores que trabajan en investigación reproducible dejan todo su trabajo documentado en sus repositorios, lo cual permite interactuar con otros autores.
Al conectar RStudio a GitHub, los investigadores pueden trabajar juntos de manera más efectiva en sus proyectos de análisis de datos, manteniendo un historial detallado de los cambios realizados en el proyecto y asegurándose de que todos los miembros del equipo estén trabajando en la misma versión del código.
En este tutorial te mostraré cómo conectar RStudio con GitHub para que aproveches al máximo esta poderosa herramienta de control de versiones.
Instalación de Git
Si es la primera vez que vas a utilizar GitHub, debes empezar por instalar Git, para lo cual, nos dirigimos a la siguiente dirección https://git-scm.com/ donde haremos clic en el botón de Downloads
.
Nos aparecerá la siguiente pantalla, aquí haremos clic en el sistema operativo de nuestro ordenador, en este caso hago clic en la opción de Windows
y después nos aparecerá la ventana para descargar el instalador en la opción que dice “Click here to download”.
Esperamos unos segundos hasta que se haya terminado de descargar el instalador, y luego abrimos el ejecutable. Aquí se abrirá la ventana del asistente de instalación de Git, donde se nos mostrarán varios pasos y configuraciones para la instalación, sólo haremos clic en Next
y escogeremos todas las opciones que nos recomiende el asistente por defecto hasta llegar a la instalación, y al finalizar haremos clic en Finish
.
Configuración de correo y usuario
Una vez que hayamos instalado Git, nos dirigimos a las aplicaciones de Windows y abrimos “Git Bash” que es la consola de comandos de Git para configurar el correo electrónico y usuario.
Para configurar el correo electrónico tecleamos el siguiente código en la consola de Git Bash: git config --global user.email "lindajzmin@gmail.com"
. En esta parte deberán digitar su correo electrónico y debe ser el mismo correo con el que tengan la cuenta en GitHub. Así mismo, para configurar el usuario tecleamos el siguiente código en la consola de Git Bash: git config --global user.name "lindajzmin"
, donde deberán introducir el respectivo usuario.
Configuración de Git en RStudio
El siguiente paso es configurar Git en Rstudio y crear la SSH key, para esto, abrimos RStudio, hacemos clic en la pestaña “Tools” de la Barra de Menú, y escogemos la opción “Global Options”. Se abrirá una ventana con un menú en la parte lateral izquierda y buscamos la opción “Git/SVN”.
En esta pantalla nos aseguramos que donde dice Git executable se encuentre la ubicación del ejecutable que se guardó en nuestros ordenadores al momento que instalamos Git. En caso de que no aparezca el ejecutable, la dirección es: C:\Program Files\Git\bin\git.exe
.
Luego procedemos a crear una clave SSH, por lo que haremos click en el botón que dice “Create SSH Key…”. Aquí aparecerá una nueva ventana donde elegimos el tipo de llave RSA
y pondremos una contraseña a esta llave creada. Hacemos clic en “Create” y nos aparecerá una ventana donde se confirma la generación de la llave RSA y la llave que es un código encriptado.
Cerramos esta ventana, y en la celda que dice “SSH key” ya nos aparece la opción “View public key”. Tener en cuenta que este código lo necesitaremos más adelanre para agregarlo a GitHub. Para cerrar esta ventana hacemos click en “OK”."
Añadir SSH key a GitHub
El siguiente paso es ligar esta llave a GitHub para que pueda conectar con RStudio. Para los que utilizan GitHub por primera vez, necesitan crear una cuenta en GitHub, en la siguiente dirección https://github.com/login, aquí deben hacer clic en “Create a new account” y aparecerá una nueva ventana donde deben ingresar un correo electrónico, contraseña y usuario para crear la cuenta.
Luego de crear la cuenta en GitHub, nos realizan una pregunta de verificación y nos envían un código al correo electrónico proporcionado. Una vez que confirme el código, GitHub le da la bienvenida y deberá contestar unas preguntas para completar su perfil, como cuántos miembros trabajarán con usted y si es un estudiante o profesor. ¡Y eso es todo! Tenemos cuenta en GitHub.
Ahora si, con nuestra cuenta de GitHub ya podemos agregar la SSH key a GitHub, para esto, ingresamos a nuestra cuenta en https://github.com/login y hacemos clic en la esquina superior derecha del panel, donde se desplegará una lista de opciones, de la cual elegiremos la opción “Settings”. Se nos abrirá una ventana con un menú de opciones en la parte lateral izquierda, donde elegiremos la opción “SSH and GPG keys”. En esta pantalla hacemos clic en el primer botón verde que indica “New SSH key”.
Al hacer clic en “New SSH key”, se abrirá una ventana donde debemos introducir un título para la SSH key, este se recomienda que sea un identificador del ordenador, y en la celda que dice “Key” debemos pegar la llave que generamos en RStudio, luego hacemos clic en el botón verde “Add SSH key”. Y tendremos la llave agregada a GitHub con los datos de título, fecha de creación y el código encriptado.
Crear repositorio en GitHub
Para trabajar de forma sincronizada entre GitHub y RStudio, es necesario trabajar con un repositorio en GitHub y con un proyecto en RStudio, estos se van a conectar y van a compartir todos los archivos que tu decidas, de tal manera que lo que realices en tu ordenador desde RStudio pueda ser visualizado en la plataforma de GitHub, siempre y cuando agregues los cambios, y todo lo que pueda ser visualizado en GitHub estará disponible para tus colegas o compañeros de equipo.
Entonces vamos a crear primero el repositorio en GitHub, ten en cuenta que este repositorio puede ser nuevo o puede ser un repositorio ya existente, en ambos casos debe funcionar igual.
Para crear un repositorio nos dirigimos a la pantalla principal de GitHub, aquí visualizaremos la pestaña que indica “Your Repositories”, hacemos clic en esta y luego hacemos clic en el botón verde que dice “New”.
Nos aparecerá un anueva ventana para configurar el nuevo repositorio donde debemos agregar un nombre, una descripción, elegimos si deseamos crear un repositorio público o privado, agregamos un archivo README y hacemos clic en “Create repository”.
Después de crear el repositorio, al volver a la pantalla de Repositorios de GitHub nos aparecerá el nuevo repositorio creado y en la esquina superior derecha del nuevo repositorio habrá un botón verde que dice “<> Code”, haremos clic aquí y en la pestaña “Local” copiaremos la dirección HTTPS. Esta dirección nos servirá para clonar el repositorio en RStudio.
Clonar repositorio en RStudio
Luego de tener un repositorio en GitHub, el cual deseo utilizar para trabajar de forma colaborativa con mi equipo o simplemente guardar mi proyecto para llevar un control de versiones eficiente, necesito clonarlo en mi ordenador. Clonar es extraer una copia integral de todos los datos del repositorio que GitHub tiene en ese momento, incluidas todas las versiones de cada archivo y carpeta del proyecto.
En esta ocasión, abarcaremos solo la parte de clonar el repositorio para ejecutar un trabajo mediante la conexión entre GitHub y RStudio. Entonces, regresamos a RStudio y vamos a crear un nuevo proyecto en “New Project…”, luego hacemos clic en la tercera opción “Version Control” y hacemos clic en “Git”. En esta parte tenemos que introducir la dirección HTTPS en la celda de “Repository URL:” y automáticamente se agregará el nombre del proyecto que será igual al nombre del repositorio clonado de GitHub, y luego hacemos clic en “Create Project”.
Y ¡voilá!… Tienes un proyecto clonado del repositorio de GitHub, compruébalo revisando que en RStudio tendrás el mismo archivo README que tiene el repositorio de GitHub. En un próximo tutorial te enseñaré cuál es la dinámica de trabajo en GitHub y todo lo que necesitas conocer para trabajar y sacarle provecho a la conexión de estas maravillosas herramientas.