Nomenclature des données
Dans l'axe Open Data du projet ORACCLE, nous utilisons des données extraites des systèmes d'informations des universités. Pour le moment ces données sont extraites uniquement du logiciel Apogée, nous mettrons à jour la nomenclature lorsque une université utilisant d'autres logiciels par exemple de l'association Cocktail ou le nouveau SI Pégase produit conjointement par l'AMUE et Cocktail dans le groupe PC Scol.
Voci un descriptif de la nomenclature des données extraites et des données ouvertes produites. Les types des données sont dans l'ordre : le type dans l'extrait de la base de donnée, le type pour les traitement (en Scala), le type pour l'API (JavaScript), si notoirement différent du type pour les traitements.
Données extraites
Donnée | Table Apogée | champ Apogée |
---|---|---|
hash_ine | INDIVIDU | cod_nne_ind |
code_postal | ADRESSE | cod_bdi |
annee_naissance | INDIVIDU | date_nai_ind |
sexe | INDIVIDU | cod_sex_etu |
academie_bac | ACADEMIE | lic_acd |
code_postal_etb_bac | ETABLISSEMENT | COD_POS_ADR_ETB |
libelle_court_bac | BAC_OUX_EQU | LIC_BAC |
annee_bac | IND_BAC | DAA_OBT_BAC_IBA |
code_etablissement_bac | IND_BAC | cod_etb |
bac_donne_acces_univ | IND_BAC | tem_ins_adm |
code_mention_bac | IND_BAC | COD_MNB |
code_specialite_bac1 | IND_BAC | COD_SPE1_BAC_TER |
code_specialite_bac2 | IND_BAC | COD_SPE2_BAC_TER |
code_specialite_bac3 | IND_BAC | COD_SPE_BAC_PRE |
code_option_bac1 | IND_BAC | COD_OPT1_BAC |
code_option_bac2 | IND_BAC | COD_OPT2_BAC |
code_option_bac3 | IND_BAC | COD_OPT3_BAC |
code_option_bac4 | IND_BAC | COD_OPT4_BAC |
annee_inscription | INS_ADM_ANU | COD_ANU |
lib_diplome | TYP_DIPLOME | LIC_TPD |
libelle_discipline_diplome | DIPLOME_SISE | LIB_INT1_DIS |
code_sise_diplome | DIPLOME_SISE | COD_DIS |
code_cycle | ETAPE | COD_CYC |
code_etape | ETAPE | COD_ETP |
libelle_court_etape | ETAPE | LIC_ETP |
libelle_long_etape | VERSION_ETAPE | LIB_WEB_VET |
libelle_court_composante | COMPOSANTE | LIC_CMP |
libelle_regime | REGIME_INS | LIC_RGI |
code_regime | REGIME_INS | COD_RGI |
Tables Apogée utilisées
tables |
---|
ACADEMIE |
ADRESSE |
BAC_OUX_EQU |
COMPOSANTE |
DEPARTEMENT |
DIPLOME |
DIPLOME_SISE |
ETABLISSEMENT |
ETAPE |
IND_BAC |
INDIVIDU |
INS_ADM_ANU |
REGIME_INS |
TYP_DIPLOME |
VERSION_DIPLOME |
VERSION_ETAPE |
Nomenclature des données publiées
Données produites
Les données publiées portent sur les cohortes
construites à partir de codes étapes et contiennent des attributs de groupes
Données extraites publiées
- Code postal
- Sexe
- Le type du baccalauréat
- Année du bac
- Code de l'établissement du bac
- Mention obtenue au bac
- Code de la première spécialité de terminale
- Code de la deuxième spécialité de terminale
- Code de la spécialité de première
- code_option_bac1
- code_option_bac2
- code_option_bac3
- code_option_bac4
- Année de l'inscription au sein de l'université
- Code de l'étape suivie
Les données suivantes sont publiées annexées au code étape. Autrement dit, on ait l'approximation que pour chaque code étape il ne peut y avoir qu'une seule valeur pour chacune des données suivantes.
- Le diplôme préparé par l'étudiant·e
- Niveau du diplôme préparé par l'étudiant·e
- Discipline du diplôme préparé par l'étudiant·e
- Code SISE du diplôme
- Code SISE du Cycle
- Libellé court (avec abréviation) de la formation préparée par l'étudiant·e
- Libellé long (sans abréviation) de la formation préparée par l'étudiant·e
- Composante où la formation à été préparée
- Régime de la formation préparée par l'étudiant·e
- Code du régime de la formation préparée par l'étudiant·e
Nomenclature détaillée
Parcours d'études
- Description : un parcours d'études est la donnée de deux séquences. Une séquence d'inscriptions dans des étapes principales de diplômes représentées par des codes étapes et une séquence de réussites à des étapes de diplômes, représentées par leurs codes étapes. Aucune autre information que les codes étapes n'est retenue. Les parcours d'études datés enrichissent cette donnée avec l'année de début du parcours.
- Identificateur :
parcours
- Type :
case class Parcours(inscriptions: Vector[String], resultats: Vector[String])
Parcours d'études avec date
- Description : un parcours d'études daté est la donnée d'une année civile, d'une séquence d'inscriptions dans des étapes principales de diplômes représentées par des codes étapes et une séquence de réussites à des étapes de diplômes. L'année civile représente l'année d'obtention du bac ou à défaut l'année de première inscription à l'université. La séquence d'inscription enchaîne les années en prenant en compte les interruptions à partir de cette première année civile, on peut ainsi en déduire l'année d'inscription dans chaque étape. Les réussites ne sont pas datées pour éviter de fausses distinctions entre parcours.
- Identificateur :
parcours_date
- Type :
case class ParcoursDate(debut: Int, inscriptions: Vector[String], resultats: Vector[String])
Groupe
- Description : un groupe d'étudiant·es est la donnée d'un nombre de personnes et des attributs de ces personnes regroupés en (multi-)ensembles d'attributs du même type. Un multi-ensemble est une collection d'éléments non ordonnées, ou dont l'ordre de présentation n'a pas de signification, dans laquelle il peut y avoir des répétitions. Ainsi un groupe de 2 hommes et 3 femmes, aura comme attribut de sexe un multi-ensemble constituté de 2
M
et 3F
, que l'on peut noter[M, M, F, F, F]
ou encore(M -> 2, F -> 3)
. Les attributs d'un groupe sont les codes postaux, années de naissances, sexes… Les codes des spécialités de terminale (code-specialite-bac1 et code-specialite-bac2) sont regroupés en un ensemble de deux éléments avant d'être aggrégés en multi-ensemble. Ainsi on évite de distinguer première et seconde spécialité ou de sépararer les paires. On fait le même traitement pour les options. L'anonymisation et plus particulièrement la k-anonymisation modifient le nombre réel de valeurs pour chaque attribut. Par exemple, s'il y a moins de k femmes ou k hommes dans un groupe, son multi-ensemble sexe sera vide. De même si le groupe est réduit à un nombre de personne inférieur à k, le nombre retenu sera 1. Autrement dit, par convention, un nombre de personnes égal à 1 signifie « moins de k personnes ». - Indentificateur :
groupe
- Type :
case class Groupe(…)
Cohorte
- Description : une cohorte est la donnée d'un ensemble de personnes ayant le même parcours et du groupe qu'elles constituent.
- Type :
case class Cohorte(groupe: Groupe, parcours: Parcours)
Cohorte datée
- Description : une cohorte datée est la donnée d'un ensemble de personnes ayant le même parcours daté et du groupe qu'elles constituent.
- Type :
case class CohorteDate(groupe: Groupe, parcours: ParcoursDate)
Condensat code INE
- Description : code identifiant national étudiant chiffré (voir la page condensat). Le code INE identifie de façon unique une personne. Pour éviter de manipuler une donnée personnelle identifiante nous lui substituons un condensat (un hash) qui conserve l'unicité mais empêche la réindentification. Après préparation des données à publier, ce condensat n'est ni mémorisé, ni publié.
- Identificateur :
hash_ine
- Types :
VARCHAR2
,String
- Table Apogée et colonne :
INDIVIDU
colonneCOD_NNE_IND
Code postal
- Description : code postal de l'adresse personnelle de l'étudiant·e.
- Identificateur :
code_postal
- Types :
VARCHAR2
,String
- Table Apogée et colonne :
ADRESSE
colonneCOD_BDI
- Commentaire : une seule adresse est retenue dans chaque établissement à l'extraction et une seule d'entre tous les établissements au moment du traitement. Cette donnée est donc sujette à caution car elle ne permet pas de suivre les changements d'adresses.
Année de naissance
- Description : année de naissance de l'étudiant·e.
- Identificateur :
annee_naissance
- Type :
VARCHAR2
extrait deDATE
,Int
,number
- Table Apogée et colonne :
INDIVIDU
colonneDATE_NAI_IND
- Commentaire : il s'agit d'un élément de la date de naissance, qui est une donnée identifiante. Est-il vraiment nécessaire ?
Sexe
- Description : sexe de l'étudiant·e.
- Identificateur :
sexe
- Type :
VARCHAR2(F,M)
,String
- Table Apogée et colonne :
INDIVIDU
colonnecod_sex_etu
- Commentaire : sur Apogée, aucune mise à jour à été faite concernant le rajout de colonne "Non-Binaire" ou "Autres"
Académie du bac
- Description : le libellé de l'académie de baccalauréat (exemple : 'Créteil','Versailles','Reims','Etranger')
- Identificateur :
academie_bac
- Type :
VARCHAR2
,String
- Table Apogée et colonne :
ACADEMIE
colonnelic_acd
- Commentaire :
Code postal de l'établissement du bac
- Description : code postal du lycée où le bac a été obtenu
- Identificateur :
code_postal_etb_bac
- Type :
VARCHAR2
,String
- Table Apogée et colonne :
ETABLISSEMENT
colonneCOD_POS_ADR_ETB
- Commentaire : le code postal est
None
si l'académie du bac est à l'étranger.
Le type du baccalauréat
- Description : type du bac obtenu par l'étudiant·e.
- Identificateur :
libelle_court_bac
- Type :
VARCHAR2
,String
- Table Apogée et colonne :
BAC_OUX_EQU
colonneLIC_BAC
- Commentaire : quelques types : 'ES-Eco','L-littérat','S-Sciences','STMG',''STG-Tech.G'
Année du bac
- Description : année de l'obtention du baccalauréat par l'étudiant·e.
- Identificateur :
annee_bac
- Type :
VARCHAR2
,String
- Table Apogée et colonne :
IND_BAC
colonneDAA_OBT_BAC_IBA
- Commentaire : la fourchette des années du bac est de (1961 à 2021)
Code de l'établissement du bac
- Description : code UAI de l'établissement d'obtention du baccalauréat
- Identificateur :
code_etablissement_bac
- Type :
VARCHAR2
,String
- Table Apogée et colonne :
IND_BAC
colonnecod_etb
- Commentaire : chaque établissement scolaire bénéficie d’un code UAI (ex-RNE) composé de 7 chiffres et d’une lettre (par exemple 0951099D)
Accès à l'université
- Description : témoin du bac d'acces à l'universite
- Identificateur :
bac_donne_acces_univ
- Type :
VARCHAR2
(SoitO
pour OUI ouN
pour NON) - Table Apogée et colonne :
IND_BAC
colonnetem_ins_adm
| - Commentaire : Sur Apogée, la colonne est
O
par défaut.
Mention obtenue au bac
- Description : code de la mention du bac obtenu par l'étudiant·e
- Identificateur :
code_mention_bac
- Type :
VARCHAR2
,String
- Table Apogée et colonne :
IND_BAC
colonneCOD_MNB
- Commentaire : les mentions disponibles : (
P
pour Passable,TB
pour Très Bien,B
pour Assez Bien,AB
pour Assez Bien)
Code de la première spécialité de terminale
- Description : code de la première spécialité choisie par l'étudiant·e en terminale
- Identificateur :
code_specialite_bac1
- Type :
VARCHAR2
,String
- Table Apogée et colonne :
IND_BAC
colonneCOD_SPE1_BAC_TER
- Commentaire : spécialité de terminale
Code de la deuxième spécialité de terminale
- Description : code de l'autre spécialité choisie par l'étudiant·e en terminale
- Identificateur :
code_specialite_bac2
- Type :
VARCHAR2
,String
- Table Apogée et colonne :
IND_BAC
colonneCOD_SPE2_BAC_TER
- Commentaire : spécialité de terminale
Code de la spécialité de première
- Description : code de la spécialité choisie par l'étudiant·e en première mais abandonnée en terminale
- Identificateur :
code_specialite_bac3
- Type :
VARCHAR2
,String
- Table Apogée et colonne :
IND_BAC
colonneCOD_SPE_BAC_TER
- Commentaire : spécialité de première abandonnée en terminale
code_option_bac1
- Description : code le première option choisie par l'étudiant·e
- Identificateur :
code_option_bac1
- Type :
VARCHAR2
,String
- Table Apogée et colonne :
IND_BAC
colonneCOD_OPT1_BAC
- Commentaire :
code_option_bac2
- Description : code le deuxième option choisie par l'étudiant·e
- Identificateur :
code_option_bac2
- Type :
VARCHAR2
,String
- Table Apogée et colonne :
IND_BAC
colonneCOD_OPT2_BAC
- Commentaire :
code_option_bac3
- Description : code le troisième option choisie par l'étudiant·e
- Identificateur :
code_option_bac3
- Type :
VARCHAR2
,String
- Table Apogée et colonne :
IND_BAC
colonneCOD_OPT3_BAC
- Commentaire :
code_option_bac4
- Description : code le quatrième option choisie par l'étudiant·e
- Identificateur :
code_option_bac4
- Type :
VARCHAR2
,String
- Table Apogée et colonne :
IND_BAC
colonneCOD_OPT4_BAC
- Commentaire :
Année de l'inscription au sein de l'université
- Description : année de l'inscription de l'étudiant·e à l'université
- Identificateur :
annee_inscription
- Type :
VARCHAR2
,String
- Table Apogée et colonne :
INS_ADM_ANU
colonneCOD_ANU
- Commentaire : si l'année de l'inscription est 2020 alors l'année de scolarité de l'étudiant est véritablement 2020-2021
Le diplôme préparé par l'étudiant·e
- Description : le diplôme préparé par l'étudiant·e au sein de l'université
- Identificateur :
lib_diplome
- Type :
VARCHAR2
,String
- Table Apogée et colonne :
TYP_DIPLOME
colonneLIC_TPD
- Commentaire : exemple de diplômes préparés : (Licence, PACES, DUT, Master1 AP, Prep AGREG)
Niveau du diplôme préparé par l'étudiant·e
- Description : niveau du diplôme préparé par l'étudiant·e à l'université (exemple si
niveau_dans_le_diplome
=1 etlib_diplome
='Licence' alors on sait que l'étudiant suit une Licence 1 ) - Identificateur :
niveau_dans_le_diplome
- Type :
VARCHAR2
,String
- Table Apogée et colonne :
VDI_FRACTIONNER_VET
colonneCOD_SIS_DAA_MIN
- Commentaire : la colonne
COD_SIS_DAA_MIN
représente l'équivalent de l'annee minimale de l'étape pour un diplôme
Discipline du diplôme préparé par l'étudiant·e
- Description : discipline du diplôme préparé par l'étudiant·e (Exemples : OPHTALMOLOGIE, ARTS, LETTRES LANGUES : LETTRES MODERNES)
- Identificateur :
libelle_discipline_diplome
- Type :
VARCHAR2
,String
- Table Apogée et colonne :
DIPLOME_SISE
colonneLIB_INT1_DIS
- Commentaire :
Code SISE du diplôme
- Description : code SISE du diplôme préparé par l'étudiant·e
- Identificateur :
code_sise_diplome
- Type :
VARCHAR2
,String
- Table Apogée et colonne :
DIPLOME_SISE
colonneCOD_DIS
- Commentaire :
Code SISE du Cycle
- Description : code SISE du cycle (0 Cycle, Premier Cycle, Deuxième Cycle, Troisième Cycle)
- Identificateur :
code_cycle
- Type :
VARCHAR2
,String
- Table Apogée et colonne :
ETAPE
colonneCOD_CYC
- Commentaire : cycle 1 pour Licence, 2 pour Master, 3 pour Doctorat
Code de l'étape préparée
- Description : code de l'étape préparée par l'étudiant·e (Exemple E2EGE Pour Licence 2 Eco-Gestion)
- Identificateur :
code_etape
- Type :
VARCHAR2
,String
- Table Apogée et colonne :
ETAPE
colonneCOD_ETP
- Commentaire :
Libellé court de la formation préparée par l'étudiant·e
- Description : libellé court (avec abréviation) de la formation préparée par l'étudiant·e (Exemple: Lic Eco-Gestion an2)
- Identificateur :
libelle_court_etape
- Type :
VARCHAR2
,String
- Table Apogée et colonne :
ETAPE
colonneLIC_ETP
- Commentaire : il n'est pas réellement nécessaire puisque, on trouve le libellé détaillé ci-dessous
Libellé long de la formation préparée par l'étudiant·e
- Description : libellé long (sans abréviation) de la formation préparée par l'étudiant·e (Exemple : Licence Économie et Gestion an2)
- Identificateur :
libelle_long_etape
- Type :
VARCHAR2
,String
- Table Apogée et colonne :
VERSION_ETAPE
colonneLIB_WEB_VET
- Commentaire :
Composante où la formation a été préparée
- Description : composante où la formation a été préparée par l'étudiant·e (Exemple : UFR SEG (Sciences économie Gestion))
- Identificateur :
libelle_court_composante
- Type :
VARCHAR2
,String
- Table Apogée et colonne :
COMPOSANTE
colonneLIC_CMP
- Commentaire : ceci est un sigle de la composante
Régime de la formation préparée par l'étudiant·e
- Description : régime de la formation préparée par l'étudiant·e (Exemple : 'initiale','apprentiss','continue')
- Identificateur :
libelle_regime
- Type :
VARCHAR2
,String
- Table Apogée et colonne :
REGIME_INS
colonneLIC_RGI
- Commentaire :
Code du régime de la formation préparée par l'étudiant·e
- Description : code du régime de la formation préparée par l'étudiant·e
- Identificateur :
code_regime
- Type :
VARCHAR2
,String
- Table Apogée et colonne :
REGIME_INS
colonneCOD_RGI
- Commentaire :
NULL
si uniquement local