Skip to content
Open
Show file tree
Hide file tree
Changes from all commits
Commits
File filter

Filter by extension

Filter by extension

Conversations
Failed to load comments.
Loading
Jump to
Jump to file
Failed to load files.
Loading
Diff view
Diff view
2 changes: 1 addition & 1 deletion 01_R_Insee/Fiche_installer_packages.qmd
Original file line number Diff line number Diff line change
Expand Up @@ -27,7 +27,7 @@ D'un point de vue technique, un _package_ est constitué d'objets `R` (la plupar

Les _packages_ `R` sont disponibles sur des sites spécialisés appelés dépôts (_repositories_ ou _repo_ en anglais). Le principal dépôt est le dépôt officiel du projet `R`, le [CRAN](https://cran.r-project.org) (_Comprehensive R Archive Network_).

Les _packages_ peuvent également être mis à disposition par leurs auteurs sur les forges logicielles (telles que Github et Gitlab), mais il s'agit alors la plupart du temps de versions expérimentales dont l'usage est principalement destiné aux utilisateurs avancés de `R`.
Les _packages_ peuvent également être mis à disposition par leurs auteurs sur les forges logicielles (telles que GitHub et Gitlab), mais il s'agit alors la plupart du temps de versions expérimentales dont l'usage est principalement destiné aux utilisateurs avancés de `R`.

::: {.callout-note}
Le CRAN dispose de plusieurs copies, appelées _miroirs_, dont la plupart sont hébergés sur des [serveurs d'universités ou d'établissements de recherche](https://cran.r-project.org/mirrors.html). Télécharger un _package_ sur un miroir ou un autre est strictement équivalent. L'intérêt de choisir un miroir proche de sa localisation permet simplement de gagner en vitesse et de réduire les flux sur le réseau.
Expand Down
10 changes: 5 additions & 5 deletions 01_R_Insee/Fiche_utiliser_Rstudio_SSPCloud.qmd
Original file line number Diff line number Diff line change
Expand Up @@ -149,18 +149,18 @@ Les principales options sont les suivantes :
- L'**option `cpu`** (dans l'onglet `Resources`) définit le nombre minimal de processeurs alloués à votre service RStudio, c'est un minimum garanti. Il est conseillé d'utiliser 2 comme valeur par défaut si vos traitements nécessitent de la parallélisation et laisser l'option par défaut sinon.
- L'**option `Enable IP protection`** (dans l'onglet `Security`) est une option de sécurité informatique assez contraignante, qui est activée par défaut. Il est conseillé de la laisser activée. Toutefois, vous pouvez éventuellement la désactiver, notamment si vous savez que vous allez devoir accéder à l'environnement RStudio depuis des adresses IP différentes (exemple : au bureau puis en télétravail).
- L'**option `version`** (dans l'onglet `Service`) détermine l'environnement dans lequel RStudio va s'ouvrir. Il s'agit d'un environnement contenant une version donnée de `R` ainsi que des packages pré-installés. Par exemple, l'image `utilitR` disponible propose l'ensemble des dépendances (elles sont nombreuses...) nécessaires pour reproduire tous les exemples présents dans cette documentation.
- L'**option `PersonalInit`** (dans l'onglet `Init`) permet de référencer un script d'initialisation qui exécutera une série d'actions prédéfinies avant de lancer le service, par exemple copier localement des données, lancer un projet RStudio ou définir des paramètres d'affichage de l'interface. Un exemple d'un tel fichier Init utilisé pour des formations peut être trouvé [ici](https://github.com/InseeFrLab/formation-r-lissage-spatial/blob/f3258469513cabd2de328dc92165641f8f452bca/utils/init.sh). C'est l'URL du fichier sur github.com qui doit être référencé, **dans sa version *Raw*** (afficher le fichier dans Github et cliquer sur `Raw` en haut à droite pour obtenir cette URL).
- L'**option `PersonalInit`** (dans l'onglet `Init`) permet de référencer un script d'initialisation qui exécutera une série d'actions prédéfinies avant de lancer le service, par exemple copier localement des données, lancer un projet RStudio ou définir des paramètres d'affichage de l'interface. Un exemple d'un tel fichier Init utilisé pour des formations peut être trouvé [ici](https://github.com/InseeFrLab/formation-r-lissage-spatial/blob/f3258469513cabd2de328dc92165641f8f452bca/utils/init.sh). C'est l'URL du fichier sur github.com qui doit être référencé, **dans sa version *Raw*** (afficher le fichier dans GitHub et cliquer sur `Raw` en haut à droite pour obtenir cette URL).

::: {.callout-note}
**Les options d'un service RStudio ne peuvent être définies qu'au moment de la création du service.** Si vous vous rendez compte qu'une option du service ne convient pas au traitement que vous voulez faire, vous devez supprimer votre service RStudio et en lancer un nouveau avec les bonnes options. Lorsqu'un ensemble d'options vous conviennent, il est possible de l'enregistrer pour les retrouver lors du prochain lancement d'un service. Pour cela, cliquez sur l'icône de marque-page en haut à droite du panneau de paramétrage. La liste des configurations ainsi définies comme favorites apparaîtront dans SSP Cloud dans la rubrique `Mes services`, dans la colonne `Enregistrés`.
:::

### Utiliser Github et Gitlab sur le SSP Cloud
### Utiliser GitHub et Gitlab sur le SSP Cloud

Les services ouverts sur le SSPCloud ont une durée de vie limitée.
Pour conserver les codes afin de pouvoir les réutiliser ultérieurement ou les
rendre disponibles à d'autres personnes, il est nécessaire d'utiliser une
plateforme type Gitlab et Github.
plateforme type Gitlab et GitHub.

Dans le catalogue des services, une plateforme Gitlab est disponible.
Son adresse est <https://git.lab.sspcloud.fr/> (c'est un [`Service partagé`](https://datalab.sspcloud.fr/services)). Cependant, elle n'apporte pas un niveau de sécurité
Expand Down Expand Up @@ -202,13 +202,13 @@ suivre en temps réel l'usage mémoire et CPU d'un service RStudio. C'est utile

Le SSP Cloud propose des environnements (comme les services ` RStudio`, `Jupyter`, etc.) pour exécuter des programmes informatiques. Ces environnements sont **temporaires par définition** (quelques heures ou quelques jours), et ne peuvent donc pas servir à stocker des données ou des programmes informatiques. Cela a pour conséquence que les programmes informatiques et les données doivent être stockés dans d'autres espaces :

* *stockage des codes* : il est nécessaire d'utiliser une plate-forme de développement pour stocker des programmes informatiques, telles que [Gitlab](www.gitlab.com) ou [Github](www.github.com).
* *stockage des codes* : il est nécessaire d'utiliser une plate-forme de développement pour stocker des programmes informatiques, telles que [Gitlab](www.gitlab.com) ou [GitHub](www.github.com).
* *stockage des données* : la plateforme SSP Cloud propose un système de stockage de données nommé S3. Depuis votre service RStudio, vous pourrez facilement accéder à des données stockées sur S3 grâce au _package_ `aws.s3`.

::: {.callout-note}
Voici deux règles à respecter pour faire un bon usage de ces deux espaces de stockage :

* Les plate-formes telles que Gitlab ou Github ne doivent **jamais** être utilisées pour stocker des données (uniquement des codes).
* Les plate-formes telles que Gitlab ou GitHub ne doivent **jamais** être utilisées pour stocker des données (uniquement des codes).
* Le système de stockage S3 ne doit **jamais** être utilisé pour stocker des données confidentielles.
:::

Expand Down
26 changes: 13 additions & 13 deletions 01_R_Insee/Travail_avec_R_Insee.qmd
Original file line number Diff line number Diff line change
Expand Up @@ -2,11 +2,11 @@

## Démarrage rapide de `R` à l'Insee

- où clique-t-on pour accéder à Rstudio? Description rapide des environnements: local, AUS, PF innovation.
- où clique-t-on pour accéder à RStudio? Description rapide des environnements: local, AUS, PF innovation.
- Comment on installe un _package_?
- Comment on crée un projet Rstudio?
- Comment on crée un projet RStudio?

## Utiliser `R` et `Rstudio` à l'Insee?
## Utiliser `R` et `RStudio` à l'Insee?

### Les différents environnements d'usage de `R` à l'Insee

Expand All @@ -16,20 +16,20 @@

#### Utiliser `R` en local

- Comment on installe `R` et Rstudio.
- Comment on lance Rstudio.
- Comment on installe `R` et RStudio.
- Comment on lance RStudio.

#### Utiliser `R` sous AUS

- Comment on se connecte à AUS;
- Comment on lance Rstudio.
- Comment on lance RStudio.

#### Utiliser `R` sur la PF innovation

- Comment on se crée un compte sur la PF innovation;
- Comment on lance un container Rstudio.
- Comment on lance un container RStudio.

### Utiliser les projets Rstudio pour structurer son travail
### Utiliser les projets RStudio pour structurer son travail

Reprendre (en version très allégée) la partie 3 de la formation Travail Collaboratif sous `R`.

Expand All @@ -42,7 +42,7 @@ Parler du fichier `.Rprofile`, et dire ce qui peut être configuré.

### Installer des _packages_

- Quelles sont les sources pour les _packages_? CRAN, Github...
- Quelles sont les sources pour les _packages_? CRAN, GitHub...
- Expliquer qu'il y a des miroirs pour AUS;
- Expliquer comment installer un _package_ (et aussi *binary* _versus_ *source*).

Expand All @@ -53,21 +53,21 @@ Cette partie peut être ici, ou transférée dans la partie Fiches thématiques.

## La gestion de version

### Utiliser Git et Rstudio
### Utiliser Git et RStudio

#### Introduction à Git

- Des bases de `Git`: Reprendre la partie 4.2 de la formation Travail Collaboratif sous R.

#### Git dans Rstudio
#### Git dans RStudio

- Où mettre son dépôt local `Git` (en local et dans AUS)
- Utiliser `Git` avec l'interface `Rstudio`
- Utiliser `Git` avec l'interface `RStudio`

### Le Gitlab interne

- Présentation du Gitlab interne
- Configurer son accès à Gitlab (SSH, Putty etc.)
- Comment travailler à plusieurs avec Gitlab? Reprendre la partie 4.4 de la formation Travail Collaboratif sous R.

## Se former à `R` à l'Insee
## Se former à `R` à l'Insee
8 changes: 4 additions & 4 deletions 01_R_Insee/presentation_utilitr.qmd
Original file line number Diff line number Diff line change
Expand Up @@ -11,12 +11,12 @@ Les contributeurs du projet `utilitR` se sont fixés pour objectif de **rassembl
**Le projet `utilitR` est un projet collaboratif, évolutif, *open source* et ouvert à tous, porté par des agents de l'Insee et du Service Statistique Public (SSP).**
Toute personne qui le souhaite peut modifier la documentation ou la compléter en fonction de ses connaissances et de ses expériences (voir [Comment contribuer au projet `utilitR`](#contribuer)).

Le code source de cette documentation est hébergé sous `Github` et est accessible en cliquant sur [ce lien](https://github.com/InseeFrLab/utilitR).
Le code source de cette documentation est hébergé sous `GitHub` et est accessible en cliquant sur [ce lien](https://github.com/InseeFrLab/utilitR).

## Comment contribuer à `utilitR`? {#contribuer}

**Le projet `utilitR` est un projet collaboratif, évolutif, *open source* et ouvert à tous, auquel tous les agents peuvent contribuer.** Le projet est mené par un groupe de contributeurs qui en définissent eux-mêmes le contenu, la structure et le calendrier.
Le dépôt de la documentation est situé sur le compte `InseeFrLab` sur la plateforme `Github` et peut
Le dépôt de la documentation est situé sur le compte `InseeFrLab` sur la plateforme `GitHub` et peut
facilement être retrouvé à [cette adresse](https://github.com/InseeFrLab/utilitR).
Les objectifs et l'approche collaborative du projet `utilitR` sont détaillés dans le document [`Manifeste.md`](https://github.com/InseeFrLab/utilitR/blob/master/Manifeste.md).

Expand All @@ -25,7 +25,7 @@ Les objectifs et l'approche collaborative du projet `utilitR` sont détaillés d
Tout agent intéressé à contribuer au projet est invité à consulter le guide des contributeurs [`CONTRIBUTING.md`](https://github.com/InseeFrLab/utilitR/blob/master/CONTRIBUTING.md).
[Ce guide](https://github.com/InseeFrLab/utilitR/blob/master/CONTRIBUTING.md)
donne également quelques astuces pour les personnes n'étant pas familières
avec `Github`.
avec `GitHub`.

## Contributeurs du projet

Expand Down Expand Up @@ -65,5 +65,5 @@ pour l'adapter à un contexte différent. Les conditions de réutilisation sont
dans la [licence](https://github.com/InseeFrLab/utilitR/blob/master/LICENSE.md).

Bien que ce ne soit en rien obligatoire,
si vous êtes réutilisateurs de la documentation, n'hésitez pas à vous signaler sur notre [`Github`](https://github.com/InseeFrLab),
si vous êtes réutilisateurs de la documentation, n'hésitez pas à vous signaler sur notre [`GitHub`](https://github.com/InseeFrLab),
vos retours pourraient permettre d'améliorer la documentation, au bénéfice de tous.
2 changes: 1 addition & 1 deletion 02_Bonnes_pratiques/02-structure-code.qmd
Original file line number Diff line number Diff line change
Expand Up @@ -212,7 +212,7 @@ détecter lors de l'exécution de scripts `R`.
Le fichier `README.md`, situé à la racine du projet,
est à la fois la carte d'identité et la vitrine du projet. En effet, comme
il s'agit du fichier qui fait office de point d'entrée
d'un projet sur `Github` ou `Gitlab`, il s'agit de la première source
d'un projet sur `GitHub` ou `Gitlab`, il s'agit de la première source
d'information pour comprendre l'objet du projet.

Idéalement, ce fichier contient :
Expand Down
6 changes: 3 additions & 3 deletions 03_Fiches_thematiques/Fiche_datatable.qmd
Original file line number Diff line number Diff line change
Expand Up @@ -200,17 +200,17 @@ dt[y > 3, newvar := 1]
</tr>
<tr>
<th>
```{asis, eval=TRUE, echo=TRUE}
```{asis, eval = TRUE, echo=TRUE}
**Signification**
```
</th>
<th>
```{asis, eval=TRUE, echo=TRUE}
```{asis, eval = TRUE, echo=TRUE}
Partir de `dt`, conserver uniquement les observations pour lesquelles `x > 3`, et créer une nouvelle variable `newvar` qui vaut 1 partout
```
</th>
<th>
```{asis, eval=TRUE, echo=TRUE}
```{asis, eval = TRUE, echo=TRUE}
Partir de `dt`, créer une nouvelle variable `newvar` qui vaut 1 pour les observations pour lesquelles `x > 3` et `NA` ailleurs</th>
```
<tr>
Expand Down
2 changes: 1 addition & 1 deletion 03_Fiches_thematiques/Fiche_donnees_spatiales.qmd
Original file line number Diff line number Diff line change
Expand Up @@ -256,7 +256,7 @@ Contrairement à ce qui pourrait être pensé, la géographie et le COG sont ré
Le *package* [COGugaison](https://antuki.github.io/COGugaison/) fournit un ensemble d'outils répondant à ce besoin. Il permet de réaliser de nombreuses modifications utiles au chargé d'études (remplacement des codes arrondissements dans Paris, Lyon, Marseille, identification du millésime géographique des données, visualisation des changements de géographie, transformation d'un millésime à un autre pour les communes, les zonages standards d'études de l'Insee, et les zonages à façon, etc.) sans avoir à mobiliser le COG.

::: {.callout-note}
Ce package n'étant pas disponible sur le CRAN, dans un environnement connecté à internet, il est nécessaire de l'installer depuis `Github`:
Ce package n'étant pas disponible sur le CRAN, dans un environnement connecté à internet, il est nécessaire de l'installer depuis `GitHub`:

```{r, eval=FALSE}
remotes::install_github("antuki/COGugaison")
Expand Down
Loading