Nomenclature des données

Dans l'axe Open Data du projet ORACCLE, nous utilisons des données extraites des systèmes d'informations des universités. Pour le moment ces données sont extraites uniquement du logiciel Apogée, nous mettrons à jour la nomenclature lorsque une université utilisant d'autres logiciels par exemple de l'association Cocktail ou le nouveau SI Pégase produit conjointement par l'AMUE et Cocktail dans le groupe PC Scol.

Voci un descriptif de la nomenclature des données extraites et des données ouvertes produites. Les types des données sont dans l'ordre : le type dans l'extrait de la base de donnée, le type pour les traitement (en Scala), le type pour l'API (JavaScript), si notoirement différent du type pour les traitements.

Données extraites

DonnéeTable Apogéechamp Apogée
hash_ineINDIVIDUcod_nne_ind
code_postalADRESSEcod_bdi
annee_naissanceINDIVIDUdate_nai_ind
sexeINDIVIDUcod_sex_etu
academie_bacACADEMIElic_acd
code_postal_etb_bacETABLISSEMENTCOD_POS_ADR_ETB
libelle_court_bacBAC_OUX_EQULIC_BAC
annee_bacIND_BACDAA_OBT_BAC_IBA
code_etablissement_bacIND_BACcod_etb
bac_donne_acces_univIND_BACtem_ins_adm
code_mention_bacIND_BACCOD_MNB
code_specialite_bac1IND_BACCOD_SPE1_BAC_TER
code_specialite_bac2IND_BACCOD_SPE2_BAC_TER
code_specialite_bac3IND_BACCOD_SPE_BAC_PRE
code_option_bac1IND_BACCOD_OPT1_BAC
code_option_bac2IND_BACCOD_OPT2_BAC
code_option_bac3IND_BACCOD_OPT3_BAC
code_option_bac4IND_BACCOD_OPT4_BAC
annee_inscriptionINS_ADM_ANUCOD_ANU
lib_diplomeTYP_DIPLOMELIC_TPD
libelle_discipline_diplomeDIPLOME_SISELIB_INT1_DIS
code_sise_diplomeDIPLOME_SISECOD_DIS
code_cycleETAPECOD_CYC
code_etapeETAPECOD_ETP
libelle_court_etapeETAPELIC_ETP
libelle_long_etapeVERSION_ETAPELIB_WEB_VET
libelle_court_composanteCOMPOSANTELIC_CMP
libelle_regimeREGIME_INSLIC_RGI
code_regimeREGIME_INSCOD_RGI

Tables Apogée utilisées

tables
ACADEMIE
ADRESSE
BAC_OUX_EQU
COMPOSANTE
DEPARTEMENT
DIPLOME
DIPLOME_SISE
ETABLISSEMENT
ETAPE
IND_BAC
INDIVIDU
INS_ADM_ANU
REGIME_INS
TYP_DIPLOME
VERSION_DIPLOME
VERSION_ETAPE

Nomenclature des données publiées

Données produites

Les données publiées portent sur les cohortes construites à partir de codes étapes et contiennent des attributs de groupes

Données extraites publiées

Les données suivantes sont publiées annexées au code étape. Autrement dit, on ait l'approximation que pour chaque code étape il ne peut y avoir qu'une seule valeur pour chacune des données suivantes.

Nomenclature détaillée

Parcours d'études

  • Description : un parcours d'études est la donnée de deux séquences. Une séquence d'inscriptions dans des étapes principales de diplômes représentées par des codes étapes et une séquence de réussites à des étapes de diplômes, représentées par leurs codes étapes. Aucune autre information que les codes étapes n'est retenue. Les parcours d'études datés enrichissent cette donnée avec l'année de début du parcours.
  • Identificateur : parcours
  • Type : case class Parcours(inscriptions: Vector[String], resultats: Vector[String])

Parcours d'études avec date

  • Description : un parcours d'études daté est la donnée d'une année civile, d'une séquence d'inscriptions dans des étapes principales de diplômes représentées par des codes étapes et une séquence de réussites à des étapes de diplômes. L'année civile représente l'année d'obtention du bac ou à défaut l'année de première inscription à l'université. La séquence d'inscription enchaîne les années en prenant en compte les interruptions à partir de cette première année civile, on peut ainsi en déduire l'année d'inscription dans chaque étape. Les réussites ne sont pas datées pour éviter de fausses distinctions entre parcours.
  • Identificateur : parcours_date
  • Type : case class ParcoursDate(debut: Int, inscriptions: Vector[String], resultats: Vector[String])

Groupe

  • Description : un groupe d'étudiant·es est la donnée d'un nombre de personnes et des attributs de ces personnes regroupés en (multi-)ensembles d'attributs du même type. Un multi-ensemble est une collection d'éléments non ordonnées, ou dont l'ordre de présentation n'a pas de signification, dans laquelle il peut y avoir des répétitions. Ainsi un groupe de 2 hommes et 3 femmes, aura comme attribut de sexe un multi-ensemble constituté de 2 M et 3 F, que l'on peut noter [M, M, F, F, F] ou encore (M -> 2, F -> 3). Les attributs d'un groupe sont les codes postaux, années de naissances, sexes… Les codes des spécialités de terminale (code-specialite-bac1 et code-specialite-bac2) sont regroupés en un ensemble de deux éléments avant d'être aggrégés en multi-ensemble. Ainsi on évite de distinguer première et seconde spécialité ou de sépararer les paires. On fait le même traitement pour les options. L'anonymisation et plus particulièrement la k-anonymisation modifient le nombre réel de valeurs pour chaque attribut. Par exemple, s'il y a moins de k femmes ou k hommes dans un groupe, son multi-ensemble sexe sera vide. De même si le groupe est réduit à un nombre de personne inférieur à k, le nombre retenu sera 1. Autrement dit, par convention, un nombre de personnes égal à 1 signifie « moins de k personnes ».
  • Indentificateur : groupe
  • Type : case class Groupe(…)

Cohorte

  • Description : une cohorte est la donnée d'un ensemble de personnes ayant le même parcours et du groupe qu'elles constituent.
  • Type : case class Cohorte(groupe: Groupe, parcours: Parcours)

Cohorte datée

  • Description : une cohorte datée est la donnée d'un ensemble de personnes ayant le même parcours daté et du groupe qu'elles constituent.
  • Type : case class CohorteDate(groupe: Groupe, parcours: ParcoursDate)

Condensat code INE

  • Description : code identifiant national étudiant chiffré (voir la page condensat). Le code INE identifie de façon unique une personne. Pour éviter de manipuler une donnée personnelle identifiante nous lui substituons un condensat (un hash) qui conserve l'unicité mais empêche la réindentification. Après préparation des données à publier, ce condensat n'est ni mémorisé, ni publié.
  • Identificateur : hash_ine
  • Types : VARCHAR2, String
  • Table Apogée et colonne : INDIVIDU colonne COD_NNE_IND

Code postal

  • Description : code postal de l'adresse personnelle de l'étudiant·e.
  • Identificateur : code_postal
  • Types : VARCHAR2, String
  • Table Apogée et colonne : ADRESSE colonne COD_BDI
  • Commentaire : une seule adresse est retenue dans chaque établissement à l'extraction et une seule d'entre tous les établissements au moment du traitement. Cette donnée est donc sujette à caution car elle ne permet pas de suivre les changements d'adresses.

Année de naissance

  • Description : année de naissance de l'étudiant·e.
  • Identificateur : annee_naissance
  • Type : VARCHAR2 extrait de DATE, Int, number
  • Table Apogée et colonne : INDIVIDU colonne DATE_NAI_IND
  • Commentaire : il s'agit d'un élément de la date de naissance, qui est une donnée identifiante. Est-il vraiment nécessaire ?

Sexe

  • Description : sexe de l'étudiant·e.
  • Identificateur : sexe
  • Type : VARCHAR2(F,M), String
  • Table Apogée et colonne : INDIVIDU colonne cod_sex_etu
  • Commentaire : sur Apogée, aucune mise à jour à été faite concernant le rajout de colonne "Non-Binaire" ou "Autres"

Académie du bac

  • Description : le libellé de l'académie de baccalauréat (exemple : 'Créteil','Versailles','Reims','Etranger')
  • Identificateur : academie_bac
  • Type : VARCHAR2,String
  • Table Apogée et colonne : ACADEMIE colonne lic_acd
  • Commentaire :

Code postal de l'établissement du bac

  • Description : code postal du lycée où le bac a été obtenu
  • Identificateur : code_postal_etb_bac
  • Type : VARCHAR2,String
  • Table Apogée et colonne : ETABLISSEMENT colonne COD_POS_ADR_ETB
  • Commentaire : le code postal est None si l'académie du bac est à l'étranger.

Le type du baccalauréat

  • Description : type du bac obtenu par l'étudiant·e.
  • Identificateur : libelle_court_bac
  • Type : VARCHAR2,String
  • Table Apogée et colonne : BAC_OUX_EQU colonne LIC_BAC
  • Commentaire : quelques types : 'ES-Eco','L-littérat','S-Sciences','STMG',''STG-Tech.G'

Année du bac

  • Description : année de l'obtention du baccalauréat par l'étudiant·e.
  • Identificateur : annee_bac
  • Type : VARCHAR2,String
  • Table Apogée et colonne : IND_BAC colonne DAA_OBT_BAC_IBA
  • Commentaire : la fourchette des années du bac est de (1961 à 2021)

Code de l'établissement du bac

  • Description : code UAI de l'établissement d'obtention du baccalauréat
  • Identificateur : code_etablissement_bac
  • Type : VARCHAR2,String
  • Table Apogée et colonne : IND_BAC colonne cod_etb
  • Commentaire : chaque établissement scolaire bénéficie d’un code UAI (ex-RNE) composé de 7 chiffres et d’une lettre (par exemple 0951099D)

Accès à l'université

  • Description : témoin du bac d'acces à l'universite
  • Identificateur : bac_donne_acces_univ
  • Type : VARCHAR2 (Soit O pour OUI ou N pour NON)
  • Table Apogée et colonne : IND_BAC colonne tem_ins_adm |
  • Commentaire : Sur Apogée, la colonne est O par défaut.

Mention obtenue au bac

  • Description : code de la mention du bac obtenu par l'étudiant·e
  • Identificateur : code_mention_bac
  • Type : VARCHAR2,String
  • Table Apogée et colonne : IND_BAC colonne COD_MNB
  • Commentaire : les mentions disponibles : (P pour Passable, TB pour Très Bien, B pour Assez Bien,AB pour Assez Bien)

Code de la première spécialité de terminale

  • Description : code de la première spécialité choisie par l'étudiant·e en terminale
  • Identificateur : code_specialite_bac1
  • Type : VARCHAR2,String
  • Table Apogée et colonne : IND_BAC colonne COD_SPE1_BAC_TER
  • Commentaire : spécialité de terminale

Code de la deuxième spécialité de terminale

  • Description : code de l'autre spécialité choisie par l'étudiant·e en terminale
  • Identificateur : code_specialite_bac2
  • Type : VARCHAR2,String
  • Table Apogée et colonne :IND_BAC colonne COD_SPE2_BAC_TER
  • Commentaire : spécialité de terminale

Code de la spécialité de première

  • Description : code de la spécialité choisie par l'étudiant·e en première mais abandonnée en terminale
  • Identificateur : code_specialite_bac3
  • Type : VARCHAR2,String
  • Table Apogée et colonne : IND_BAC colonne COD_SPE_BAC_TER
  • Commentaire : spécialité de première abandonnée en terminale

code_option_bac1

  • Description : code le première option choisie par l'étudiant·e
  • Identificateur : code_option_bac1
  • Type : VARCHAR2,String
  • Table Apogée et colonne : IND_BAC colonne COD_OPT1_BAC
  • Commentaire :

code_option_bac2

  • Description : code le deuxième option choisie par l'étudiant·e
  • Identificateur : code_option_bac2
  • Type : VARCHAR2,String
  • Table Apogée et colonne : IND_BAC colonne COD_OPT2_BAC
  • Commentaire :

code_option_bac3

  • Description : code le troisième option choisie par l'étudiant·e
  • Identificateur : code_option_bac3
  • Type : VARCHAR2,String
  • Table Apogée et colonne : IND_BAC colonne COD_OPT3_BAC
  • Commentaire :

code_option_bac4

  • Description : code le quatrième option choisie par l'étudiant·e
  • Identificateur : code_option_bac4
  • Type : VARCHAR2,String
  • Table Apogée et colonne : IND_BAC colonne COD_OPT4_BAC
  • Commentaire :

Année de l'inscription au sein de l'université

  • Description : année de l'inscription de l'étudiant·e à l'université
  • Identificateur : annee_inscription
  • Type : VARCHAR2,String
  • Table Apogée et colonne : INS_ADM_ANU colonne COD_ANU
  • Commentaire : si l'année de l'inscription est 2020 alors l'année de scolarité de l'étudiant est véritablement 2020-2021

Le diplôme préparé par l'étudiant·e

  • Description : le diplôme préparé par l'étudiant·e au sein de l'université
  • Identificateur : lib_diplome
  • Type : VARCHAR2,String
  • Table Apogée et colonne : TYP_DIPLOME colonne LIC_TPD
  • Commentaire : exemple de diplômes préparés : (Licence, PACES, DUT, Master1 AP, Prep AGREG)

Niveau du diplôme préparé par l'étudiant·e

  • Description : niveau du diplôme préparé par l'étudiant·e à l'université (exemple si niveau_dans_le_diplome=1 et lib_diplome='Licence' alors on sait que l'étudiant suit une Licence 1 )
  • Identificateur : niveau_dans_le_diplome
  • Type : VARCHAR2,String
  • Table Apogée et colonne : VDI_FRACTIONNER_VET colonne COD_SIS_DAA_MIN
  • Commentaire : la colonne COD_SIS_DAA_MIN représente l'équivalent de l'annee minimale de l'étape pour un diplôme

Discipline du diplôme préparé par l'étudiant·e

  • Description : discipline du diplôme préparé par l'étudiant·e (Exemples : OPHTALMOLOGIE, ARTS, LETTRES LANGUES : LETTRES MODERNES)
  • Identificateur : libelle_discipline_diplome
  • Type : VARCHAR2,String
  • Table Apogée et colonne : DIPLOME_SISE colonne LIB_INT1_DIS
  • Commentaire :

Code SISE du diplôme

  • Description : code SISE du diplôme préparé par l'étudiant·e
  • Identificateur : code_sise_diplome
  • Type : VARCHAR2,String
  • Table Apogée et colonne : DIPLOME_SISE colonne COD_DIS
  • Commentaire :

Code SISE du Cycle

  • Description : code SISE du cycle (0 Cycle, Premier Cycle, Deuxième Cycle, Troisième Cycle)
  • Identificateur : code_cycle
  • Type : VARCHAR2,String
  • Table Apogée et colonne : ETAPE colonne COD_CYC
  • Commentaire : cycle 1 pour Licence, 2 pour Master, 3 pour Doctorat

Code de l'étape préparée

  • Description : code de l'étape préparée par l'étudiant·e (Exemple E2EGE Pour Licence 2 Eco-Gestion)
  • Identificateur : code_etape
  • Type : VARCHAR2,String
  • Table Apogée et colonne : ETAPE colonne COD_ETP
  • Commentaire :

Libellé court de la formation préparée par l'étudiant·e

  • Description : libellé court (avec abréviation) de la formation préparée par l'étudiant·e (Exemple: Lic Eco-Gestion an2)
  • Identificateur : libelle_court_etape
  • Type : VARCHAR2,String
  • Table Apogée et colonne : ETAPE colonne LIC_ETP
  • Commentaire : il n'est pas réellement nécessaire puisque, on trouve le libellé détaillé ci-dessous

Libellé long de la formation préparée par l'étudiant·e

  • Description : libellé long (sans abréviation) de la formation préparée par l'étudiant·e (Exemple : Licence Économie et Gestion an2)
  • Identificateur : libelle_long_etape
  • Type : VARCHAR2,String
  • Table Apogée et colonne : VERSION_ETAPE colonne LIB_WEB_VET
  • Commentaire :

Composante où la formation a été préparée

  • Description : composante où la formation a été préparée par l'étudiant·e (Exemple : UFR SEG (Sciences économie Gestion))
  • Identificateur : libelle_court_composante
  • Type : VARCHAR2,String
  • Table Apogée et colonne : COMPOSANTE colonne LIC_CMP
  • Commentaire : ceci est un sigle de la composante

Régime de la formation préparée par l'étudiant·e

  • Description : régime de la formation préparée par l'étudiant·e (Exemple : 'initiale','apprentiss','continue')
  • Identificateur : libelle_regime
  • Type : VARCHAR2,String
  • Table Apogée et colonne : REGIME_INS colonne LIC_RGI
  • Commentaire :

Code du régime de la formation préparée par l'étudiant·e

  • Description : code du régime de la formation préparée par l'étudiant·e
  • Identificateur : code_regime
  • Type : VARCHAR2,String
  • Table Apogée et colonne : REGIME_INS colonne COD_RGI
  • Commentaire : NULL si uniquement local