Nomenclature des données
Dans l'axe Open Data du projet ORACCLE, nous utilisons des données extraites des systèmes d'informations des universités. Pour le moment ces données sont extraites uniquement du logiciel Apogée, nous mettrons à jour la nomenclature lorsque une université utilisant d'autres logiciels par exemple de l'association Cocktail ou le nouveau SI Pégase produit conjointement par l'AMUE et Cocktail dans le groupe PC Scol.
Voci un descriptif de la nomenclature des données extraites et des données ouvertes produites. Les types des données sont dans l'ordre : le type dans l'extrait de la base de donnée, le type pour les traitement (en Scala), le type pour l'API (JavaScript), si notoirement différent du type pour les traitements.
Données extraites
| Donnée | Table Apogée | champ Apogée |
|---|---|---|
hash_ine | INDIVIDU | cod_nne_ind |
code_postal | ADRESSE | cod_bdi |
annee_naissance | INDIVIDU | date_nai_ind |
sexe | INDIVIDU | cod_sex_etu |
academie_bac | ACADEMIE | lic_acd |
code_postal_etb_bac | ETABLISSEMENT | COD_POS_ADR_ETB |
libelle_court_bac | BAC_OUX_EQU | LIC_BAC |
annee_bac | IND_BAC | DAA_OBT_BAC_IBA |
code_etablissement_bac | IND_BAC | cod_etb |
bac_donne_acces_univ | IND_BAC | tem_ins_adm |
code_mention_bac | IND_BAC | COD_MNB |
code_specialite_bac1 | IND_BAC | COD_SPE1_BAC_TER |
code_specialite_bac2 | IND_BAC | COD_SPE2_BAC_TER |
code_specialite_bac3 | IND_BAC | COD_SPE_BAC_PRE |
code_option_bac1 | IND_BAC | COD_OPT1_BAC |
code_option_bac2 | IND_BAC | COD_OPT2_BAC |
code_option_bac3 | IND_BAC | COD_OPT3_BAC |
code_option_bac4 | IND_BAC | COD_OPT4_BAC |
annee_inscription | INS_ADM_ANU | COD_ANU |
lib_diplome | TYP_DIPLOME | LIC_TPD |
libelle_discipline_diplome | DIPLOME_SISE | LIB_INT1_DIS |
code_sise_diplome | DIPLOME_SISE | COD_DIS |
code_cycle | ETAPE | COD_CYC |
code_etape | ETAPE | COD_ETP |
libelle_court_etape | ETAPE | LIC_ETP |
libelle_long_etape | VERSION_ETAPE | LIB_WEB_VET |
libelle_court_composante | COMPOSANTE | LIC_CMP |
libelle_regime | REGIME_INS | LIC_RGI |
code_regime | REGIME_INS | COD_RGI |
Tables Apogée utilisées
| tables |
|---|
| ACADEMIE |
| ADRESSE |
| BAC_OUX_EQU |
| COMPOSANTE |
| DEPARTEMENT |
| DIPLOME |
| DIPLOME_SISE |
| ETABLISSEMENT |
| ETAPE |
| IND_BAC |
| INDIVIDU |
| INS_ADM_ANU |
| REGIME_INS |
| TYP_DIPLOME |
| VERSION_DIPLOME |
| VERSION_ETAPE |
Nomenclature des données publiées
Données produites
Les données publiées portent sur les cohortes construites à partir de codes étapes et contiennent des attributs de groupes
Données extraites publiées
- Code postal
- Sexe
- Le type du baccalauréat
- Année du bac
- Code de l'établissement du bac
- Mention obtenue au bac
- Code de la première spécialité de terminale
- Code de la deuxième spécialité de terminale
- Code de la spécialité de première
- code_option_bac1
- code_option_bac2
- code_option_bac3
- code_option_bac4
- Année de l'inscription au sein de l'université
- Code de l'étape suivie
Les données suivantes sont publiées annexées au code étape. Autrement dit, on ait l'approximation que pour chaque code étape il ne peut y avoir qu'une seule valeur pour chacune des données suivantes.
- Le diplôme préparé par l'étudiant·e
- Niveau du diplôme préparé par l'étudiant·e
- Discipline du diplôme préparé par l'étudiant·e
- Code SISE du diplôme
- Code SISE du Cycle
- Libellé court (avec abréviation) de la formation préparée par l'étudiant·e
- Libellé long (sans abréviation) de la formation préparée par l'étudiant·e
- Composante où la formation à été préparée
- Régime de la formation préparée par l'étudiant·e
- Code du régime de la formation préparée par l'étudiant·e
Nomenclature détaillée
Parcours d'études
- Description : un parcours d'études est la donnée de deux séquences. Une séquence d'inscriptions dans des étapes principales de diplômes représentées par des codes étapes et une séquence de réussites à des étapes de diplômes, représentées par leurs codes étapes. Aucune autre information que les codes étapes n'est retenue. Les parcours d'études datés enrichissent cette donnée avec l'année de début du parcours.
- Identificateur :
parcours - Type :
case class Parcours(inscriptions: Vector[String], resultats: Vector[String])
Parcours d'études avec date
- Description : un parcours d'études daté est la donnée d'une année civile, d'une séquence d'inscriptions dans des étapes principales de diplômes représentées par des codes étapes et une séquence de réussites à des étapes de diplômes. L'année civile représente l'année d'obtention du bac ou à défaut l'année de première inscription à l'université. La séquence d'inscription enchaîne les années en prenant en compte les interruptions à partir de cette première année civile, on peut ainsi en déduire l'année d'inscription dans chaque étape. Les réussites ne sont pas datées pour éviter de fausses distinctions entre parcours.
- Identificateur :
parcours_date - Type :
case class ParcoursDate(debut: Int, inscriptions: Vector[String], resultats: Vector[String])
Groupe
- Description : un groupe d'étudiant·es est la donnée d'un nombre de personnes et des attributs de ces personnes regroupés en (multi-)ensembles d'attributs du même type. Un multi-ensemble est une collection d'éléments non ordonnées, ou dont l'ordre de présentation n'a pas de signification, dans laquelle il peut y avoir des répétitions. Ainsi un groupe de 2 hommes et 3 femmes, aura comme attribut de sexe un multi-ensemble constituté de 2
Met 3F, que l'on peut noter[M, M, F, F, F]ou encore(M -> 2, F -> 3). Les attributs d'un groupe sont les codes postaux, années de naissances, sexes… Les codes des spécialités de terminale (code-specialite-bac1 et code-specialite-bac2) sont regroupés en un ensemble de deux éléments avant d'être aggrégés en multi-ensemble. Ainsi on évite de distinguer première et seconde spécialité ou de sépararer les paires. On fait le même traitement pour les options. L'anonymisation et plus particulièrement la k-anonymisation modifient le nombre réel de valeurs pour chaque attribut. Par exemple, s'il y a moins de k femmes ou k hommes dans un groupe, son multi-ensemble sexe sera vide. De même si le groupe est réduit à un nombre de personne inférieur à k, le nombre retenu sera 1. Autrement dit, par convention, un nombre de personnes égal à 1 signifie « moins de k personnes ». - Indentificateur :
groupe - Type :
case class Groupe(…)
Cohorte
- Description : une cohorte est la donnée d'un ensemble de personnes ayant le même parcours et du groupe qu'elles constituent.
- Type :
case class Cohorte(groupe: Groupe, parcours: Parcours)
Cohorte datée
- Description : une cohorte datée est la donnée d'un ensemble de personnes ayant le même parcours daté et du groupe qu'elles constituent.
- Type :
case class CohorteDate(groupe: Groupe, parcours: ParcoursDate)
Condensat code INE
- Description : code identifiant national étudiant chiffré (voir la page condensat). Le code INE identifie de façon unique une personne. Pour éviter de manipuler une donnée personnelle identifiante nous lui substituons un condensat (un hash) qui conserve l'unicité mais empêche la réindentification. Après préparation des données à publier, ce condensat n'est ni mémorisé, ni publié.
- Identificateur :
hash_ine - Types :
VARCHAR2,String - Table Apogée et colonne :
INDIVIDUcolonneCOD_NNE_IND
Code postal
- Description : code postal de l'adresse personnelle de l'étudiant·e.
- Identificateur :
code_postal - Types :
VARCHAR2,String - Table Apogée et colonne :
ADRESSEcolonneCOD_BDI - Commentaire : une seule adresse est retenue dans chaque établissement à l'extraction et une seule d'entre tous les établissements au moment du traitement. Cette donnée est donc sujette à caution car elle ne permet pas de suivre les changements d'adresses.
Année de naissance
- Description : année de naissance de l'étudiant·e.
- Identificateur :
annee_naissance - Type :
VARCHAR2extrait deDATE,Int,number - Table Apogée et colonne :
INDIVIDUcolonneDATE_NAI_IND - Commentaire : il s'agit d'un élément de la date de naissance, qui est une donnée identifiante. Est-il vraiment nécessaire ?
Sexe
- Description : sexe de l'étudiant·e.
- Identificateur :
sexe - Type :
VARCHAR2(F,M),String - Table Apogée et colonne :
INDIVIDUcolonnecod_sex_etu - Commentaire : sur Apogée, aucune mise à jour à été faite concernant le rajout de colonne "Non-Binaire" ou "Autres"
Académie du bac
- Description : le libellé de l'académie de baccalauréat (exemple : 'Créteil','Versailles','Reims','Etranger')
- Identificateur :
academie_bac - Type :
VARCHAR2,String - Table Apogée et colonne :
ACADEMIEcolonnelic_acd - Commentaire :
Code postal de l'établissement du bac
- Description : code postal du lycée où le bac a été obtenu
- Identificateur :
code_postal_etb_bac - Type :
VARCHAR2,String - Table Apogée et colonne :
ETABLISSEMENTcolonneCOD_POS_ADR_ETB - Commentaire : le code postal est
Nonesi l'académie du bac est à l'étranger.
Le type du baccalauréat
- Description : type du bac obtenu par l'étudiant·e.
- Identificateur :
libelle_court_bac - Type :
VARCHAR2,String - Table Apogée et colonne :
BAC_OUX_EQUcolonneLIC_BAC - Commentaire : quelques types : 'ES-Eco','L-littérat','S-Sciences','STMG',''STG-Tech.G'
Année du bac
- Description : année de l'obtention du baccalauréat par l'étudiant·e.
- Identificateur :
annee_bac - Type :
VARCHAR2,String - Table Apogée et colonne :
IND_BACcolonneDAA_OBT_BAC_IBA - Commentaire : la fourchette des années du bac est de (1961 à 2021)
Code de l'établissement du bac
- Description : code UAI de l'établissement d'obtention du baccalauréat
- Identificateur :
code_etablissement_bac - Type :
VARCHAR2,String - Table Apogée et colonne :
IND_BACcolonnecod_etb - Commentaire : chaque établissement scolaire bénéficie d’un code UAI (ex-RNE) composé de 7 chiffres et d’une lettre (par exemple 0951099D)
Accès à l'université
- Description : témoin du bac d'acces à l'universite
- Identificateur :
bac_donne_acces_univ - Type :
VARCHAR2(SoitOpour OUI ouNpour NON) - Table Apogée et colonne :
IND_BACcolonnetem_ins_adm| - Commentaire : Sur Apogée, la colonne est
Opar défaut.
Mention obtenue au bac
- Description : code de la mention du bac obtenu par l'étudiant·e
- Identificateur :
code_mention_bac - Type :
VARCHAR2,String - Table Apogée et colonne :
IND_BACcolonneCOD_MNB - Commentaire : les mentions disponibles : (
Ppour Passable,TBpour Très Bien,Bpour Assez Bien,ABpour Assez Bien)
Code de la première spécialité de terminale
- Description : code de la première spécialité choisie par l'étudiant·e en terminale
- Identificateur :
code_specialite_bac1 - Type :
VARCHAR2,String - Table Apogée et colonne :
IND_BACcolonneCOD_SPE1_BAC_TER - Commentaire : spécialité de terminale
Code de la deuxième spécialité de terminale
- Description : code de l'autre spécialité choisie par l'étudiant·e en terminale
- Identificateur :
code_specialite_bac2 - Type :
VARCHAR2,String - Table Apogée et colonne :
IND_BACcolonneCOD_SPE2_BAC_TER - Commentaire : spécialité de terminale
Code de la spécialité de première
- Description : code de la spécialité choisie par l'étudiant·e en première mais abandonnée en terminale
- Identificateur :
code_specialite_bac3 - Type :
VARCHAR2,String - Table Apogée et colonne :
IND_BACcolonneCOD_SPE_BAC_TER - Commentaire : spécialité de première abandonnée en terminale
code_option_bac1
- Description : code le première option choisie par l'étudiant·e
- Identificateur :
code_option_bac1 - Type :
VARCHAR2,String - Table Apogée et colonne :
IND_BACcolonneCOD_OPT1_BAC - Commentaire :
code_option_bac2
- Description : code le deuxième option choisie par l'étudiant·e
- Identificateur :
code_option_bac2 - Type :
VARCHAR2,String - Table Apogée et colonne :
IND_BACcolonneCOD_OPT2_BAC - Commentaire :
code_option_bac3
- Description : code le troisième option choisie par l'étudiant·e
- Identificateur :
code_option_bac3 - Type :
VARCHAR2,String - Table Apogée et colonne :
IND_BACcolonneCOD_OPT3_BAC - Commentaire :
code_option_bac4
- Description : code le quatrième option choisie par l'étudiant·e
- Identificateur :
code_option_bac4 - Type :
VARCHAR2,String - Table Apogée et colonne :
IND_BACcolonneCOD_OPT4_BAC - Commentaire :
Année de l'inscription au sein de l'université
- Description : année de l'inscription de l'étudiant·e à l'université
- Identificateur :
annee_inscription - Type :
VARCHAR2,String - Table Apogée et colonne :
INS_ADM_ANUcolonneCOD_ANU - Commentaire : si l'année de l'inscription est 2020 alors l'année de scolarité de l'étudiant est véritablement 2020-2021
Le diplôme préparé par l'étudiant·e
- Description : le diplôme préparé par l'étudiant·e au sein de l'université
- Identificateur :
lib_diplome - Type :
VARCHAR2,String - Table Apogée et colonne :
TYP_DIPLOMEcolonneLIC_TPD - Commentaire : exemple de diplômes préparés : (Licence, PACES, DUT, Master1 AP, Prep AGREG)
Niveau du diplôme préparé par l'étudiant·e
- Description : niveau du diplôme préparé par l'étudiant·e à l'université (exemple si
niveau_dans_le_diplome=1 etlib_diplome='Licence' alors on sait que l'étudiant suit une Licence 1 ) - Identificateur :
niveau_dans_le_diplome - Type :
VARCHAR2,String - Table Apogée et colonne :
VDI_FRACTIONNER_VETcolonneCOD_SIS_DAA_MIN - Commentaire : la colonne
COD_SIS_DAA_MINreprésente l'équivalent de l'annee minimale de l'étape pour un diplôme
Discipline du diplôme préparé par l'étudiant·e
- Description : discipline du diplôme préparé par l'étudiant·e (Exemples : OPHTALMOLOGIE, ARTS, LETTRES LANGUES : LETTRES MODERNES)
- Identificateur :
libelle_discipline_diplome - Type :
VARCHAR2,String - Table Apogée et colonne :
DIPLOME_SISEcolonneLIB_INT1_DIS - Commentaire :
Code SISE du diplôme
- Description : code SISE du diplôme préparé par l'étudiant·e
- Identificateur :
code_sise_diplome - Type :
VARCHAR2,String - Table Apogée et colonne :
DIPLOME_SISEcolonneCOD_DIS - Commentaire :
Code SISE du Cycle
- Description : code SISE du cycle (0 Cycle, Premier Cycle, Deuxième Cycle, Troisième Cycle)
- Identificateur :
code_cycle - Type :
VARCHAR2,String - Table Apogée et colonne :
ETAPEcolonneCOD_CYC - Commentaire : cycle 1 pour Licence, 2 pour Master, 3 pour Doctorat
Code de l'étape préparée
- Description : code de l'étape préparée par l'étudiant·e (Exemple E2EGE Pour Licence 2 Eco-Gestion)
- Identificateur :
code_etape - Type :
VARCHAR2,String - Table Apogée et colonne :
ETAPEcolonneCOD_ETP - Commentaire :
Libellé court de la formation préparée par l'étudiant·e
- Description : libellé court (avec abréviation) de la formation préparée par l'étudiant·e (Exemple: Lic Eco-Gestion an2)
- Identificateur :
libelle_court_etape - Type :
VARCHAR2,String - Table Apogée et colonne :
ETAPEcolonneLIC_ETP - Commentaire : il n'est pas réellement nécessaire puisque, on trouve le libellé détaillé ci-dessous
Libellé long de la formation préparée par l'étudiant·e
- Description : libellé long (sans abréviation) de la formation préparée par l'étudiant·e (Exemple : Licence Économie et Gestion an2)
- Identificateur :
libelle_long_etape - Type :
VARCHAR2,String - Table Apogée et colonne :
VERSION_ETAPEcolonneLIB_WEB_VET - Commentaire :
Composante où la formation a été préparée
- Description : composante où la formation a été préparée par l'étudiant·e (Exemple : UFR SEG (Sciences économie Gestion))
- Identificateur :
libelle_court_composante - Type :
VARCHAR2,String - Table Apogée et colonne :
COMPOSANTEcolonneLIC_CMP - Commentaire : ceci est un sigle de la composante
Régime de la formation préparée par l'étudiant·e
- Description : régime de la formation préparée par l'étudiant·e (Exemple : 'initiale','apprentiss','continue')
- Identificateur :
libelle_regime - Type :
VARCHAR2,String - Table Apogée et colonne :
REGIME_INScolonneLIC_RGI - Commentaire :
Code du régime de la formation préparée par l'étudiant·e
- Description : code du régime de la formation préparée par l'étudiant·e
- Identificateur :
code_regime - Type :
VARCHAR2,String - Table Apogée et colonne :
REGIME_INScolonneCOD_RGI - Commentaire :
NULLsi uniquement local