[TOC]
Route de récupération d'une collection de notices au format JSON dont le nombre dépend de l'argument page_size
. La taille maximale de cette collection est de 1000. Pour récupérer plus de notices vous devez utiliser l'API Scroll.
Une recherche plus fine peut être effectuée grâce au paramètre d'url q
. Utilisez la syntaxe Lucene pour forger une requête de recherche.
Il est aussi possible de faire une requête sur un champ imbriqué (par exemple, le champ authors). Pour cela, il suffit de faire précéder la requête lucène avec le champ imbriqué racine et séparé par un chevron '>'.
Paramètres d'URL
-
scroll
(durationString) : Spécifie combien de temps une représentation consistante sera maintenue pour l'opération de scroll (max: 5m, unités: d|h|m|s|ms|micros|nanos). -
includes
(string) : Une liste de champs à extraire et à retourner dans la réponse. -
excludes
(string) : Une liste de champs à exclure de la réponse. -
page
(number) : le numéro de la page demandé (voir documentation complète) -
page_size
(number) : le nombre de résultats par page, doit être inférieur ou égal à 1000 -
q
(string) : UneQuery Lucene
, entouré de simple ou double guillements, qui permet de filtrer et trier les notices grâce à un score de pertinence. -
aggs
(string) : Une query qui permet d'obtenir des aggrégations et statistiques. -
sort
(string) : Une expression permettant de trier une liste de résultats selon un ou plusieurs champs
Retourne
(jsonArray) : Retourne un tableau contenant les résultats sous forme d'objet.
Exemples
Faire une recherche sur un nom d'auteur :
https://api.conditor.fr/v1/records?q="first3AuthorNames:bob"&access_token=
Faire une recherche sur les codes RNSR (nested query) :
https://api.conditor.fr/v1/records?q=authors>affiliations>"authors.affiliations.rnsr:199218201Y"&access_token=
Faire une recherche sur les adresses des affiliations auteurs (nested query) :
https://api.conditor.fr/v1/records?q=authors>affiliations>"authors.affiliations.address:rennes"&access_token=
Déclencher un scroll :
https://api.conditor.fr/v1/records?scroll=5m&access_token=
Renvoyer uniquement le champ authors de chaque notice :
https://api.conditor.fr/v1/records?includes=authors&access_token=
Renvoyer uniquement les champs authors et idConditor de chaque notice :
https://api.conditor.fr/v1/records?includes=authors,idConditor&access_token=
Renvoyer uniquement le sous-champ surname de authors de chaque notice :
https://api.conditor.fr/v1/records?includes=authors.surname&access_token=
Exclure le champ authors :
https://api.conditor.fr/v1/records?excludes=authors&access_token=
Cumuler les paramètres excludes
et includes
:
https://api.conditor.fr/v1/records?includes=authors&excludes=authors.surname&access_token=
Choisir nombre de résultats retournés :
https://api.conditor.fr/v1/records?page_size=100&access_token=
Route de récupération des notices de la base Conditor dans une archive ZIP. Chaque notice est stockée au format JSON dans un fichier nommé d'après l'idConditor.
Une recherche plus fine peut être effectuée grâce au paramètre d'url q
. Utilisez la syntaxe Lucene pour forger une requête de recherche.
Paramètres d'URL
includes
(string) : Une liste de champs à extraire et à retourner dans la réponse.excludes
(string) : Une liste de champs à exclure de la réponse.q
(string) : UneQuery Lucene
, entourée de simple ou double guillements, qui permet de filtrer et trier les notices grâce à un score de pertinence.limit
(number): Limite le nombre de résultats renvoyés dans l'archive ZIP.sort
(string) : Une liste de critères qui permet de trier la liste des résultats
Retourne
(binary) : Retourne une archive ZIP.
Exemples
Récupérer toutes les notices dans une archive en incluant uniquement le titre et la date de création.
https://api.conditor.fr/v1/records/zip?includes=title,creationDate&access_token=
Route de récupération d'une collection de notices au format JSON dont le nombre dépend de l'argument page_size
. La taille maximale de cette collection est de 1000. Pour récupérer plus de notices vous devez utiliser l'API Scroll.
La collection peut être filtrée en fonction de différents arguments facultatifs de la route. Ces arguments doivent respecter l'ordre décrit ci-dessous. Ce type de filtre n'impacte pas le score de pertinence.
Une recherche plus fine peut être effectuée grâce au paramètre d'url q
. Utilisez la syntaxe Lucene pour forger une requête de recherche.
Arguments de la route
source
(string) : Le nom d'un des corpus source de Conditor (ex: sudoc)year
(string) : Année de publication (ex: 2014)duplicate
(flagString) : Permet de filtrer les notices marquées en tant que doublon certain ou non (flag: duplicate|not_duplicate)near_duplicate
(flagString) : Permet de filtrer les notices marquées en tant que doublon incertain ou non (flag: near_duplicate|not_near_duplicate)
Paramètres d'URL
scroll
(durationString) : Spécifie combien de temps une représentation consistante sera maintenue pour l'opération de scroll (max: 5m, unités: d|h|m|s|ms|micros|nanos).includes
(string) : Une liste de champs à extraire et retourner dans la réponse.excludes
(string) : Une liste de champs à exclure de la réponse.page
(number) : le numéro de la page demandée (voir documentation complète)page_size
(number) : le nombre de résultats par page, doit être inférieur ou égal à 1000q
(string) : UneQuery Lucene
, entourée de simple ou double guillements, qui permet de filtrer et trier les notices grâce à un score de pertinence.aggs
(string) : Une query qui permet d'obtenir des aggrégations et statistiques.sort
(string) : Une liste de critères qui permet de trier la liste des résultats
Retourne
(jsonArray) : Retourne un tableau contenant les résultats sous forme d'objet.
Exemples
Filtrer la réponse afin de récupérer des notices de hal publiées en 2014 marquées comme non-doublon :
https://api.conditor.fr/v1/records/_filter/hal/2014/not_duplicate&access_token=
Filtrer la réponse afin de récupérer des notices de hal publiées en 2014 marquées comme non-doublon en incluant uniquement l'idConditor :
https://api.conditor.fr/v1/records/_filter/hal/2014/not_duplicate?includes=idConditor&access_token=
Filtrer la réponse afin de récupérer les notices publiées en 2014 marquées comme doublon certain et doublon incertain en incluant uniquement l'idConditor et le titre. Le tout filtré par une recherche sur l'auteur :
https://api.conditor.fr/v1/records/_filter/2014/duplicate/near_duplicate?includes=idConditor,title&q="first3AuthorNames:bob"&access_token=
Route de récupération d'une collection de notices dans une archive ZIP. Chaque notice est stockée au format JSON dans un fichier nommé d'après l'idConditor.
La collection peut être filtrée en fonction de différents arguments facultatifs de la route. Ces arguments doivent respecter l'ordre décrit ci-dessous. Ce type de filtre n'impacte pas le score de pertinence.
Une recherche plus fine peut être effectuée grâce au paramètre d'url q
. Utilisez la syntaxe Lucene pour forger une requête de recherche.
Arguments de la route
source
(string) : Le nom d'un des corpus source de Conditor (ex: sudoc)year
(string) : Année de publication (ex: 2014)duplicate
(flagString) : Permet de filtrer les notices marquées en tant que doublon certain ou non (flag: duplicate|not_duplicate)near_duplicate
(flagString) : Permet de filtrer les notices marquées en tant que doublon incertain ou non (flag: near_duplicate|not_near_duplicate)
Paramètres d'URL
includes
(string) : Une liste de champs à extraire et à retourner dans la réponse.excludes
(string) : Une liste de champs à exclure de la réponse.q
(string) : UneQuery Lucene
, entourée de simple ou double guillements, qui permet de filtrer et trier les notices grâce à un score de pertinence.limit
(number): Limite le nombre de résultats renvoyés dans l'archive ZIP.sort
(string) : Une liste de critères qui permet de trier la liste des résultats
Retourne
(binary) : Retourne une archive ZIP.
Exemples
Filtrer la réponse afin de récupérer une archive des notices de hal publiées en 2014 marquées comme non-doublon :
https://api.conditor.fr/v1/records/_filter/hal/2014/not_duplicate/zip&access_token=
Filtrer la réponse afin de récupérer une archive des notices de hal publiées en 2015 marquées comme doublon en incluant uniquement l'idConditor.
https://api.conditor.fr/v1/records/_filter/hal/2015/duplicate/zip?includes=idConditor&access_token=
Route de récupération d'une notice identifiée par son idConditor.
Arguments de la route
id_conditor
(string) : Identifiant Conditor de la notice recherchée
Paramètres d'URL
includes
(string) : Une liste de champs à extraire et à retourner dans la réponse.excludes
(string) : Une liste de champs à exclure de la réponse.aggs
(string) : Une query qui permet d'obtenir des aggrégations et statistiques.
Retourne
(jsonObject) : Retourne une unique notice sous la forme d'un objet JSON .
Exemples
Récupérer une notice identifiée :
https://api.conditor.fr/v1/records/xXFCmTU2kwDkCTJlyQz1gOgBz?&access_token=
Récupérer une notice identifiée et extraire le champ title :
https://api.conditor.fr/v1/records/xXFCmTU2kwDkCTJlyQz1gOgBz?includes=title&access_token=
Route de récupération du TEI d'une notice identifiée.
Arguments de la route
id_conditor
(string) : Identifiant Conditor de la notice recherchée
Retourne
(tei) : Retourne le fichier TEI-Conditor de la notice.
Exemples
Récupérer le TEI d'une notice identifiée :
https://api.conditor.fr/v1/records/xXFCmTU2kwDkCTJlyQz1gOgBz/tei?&access_token=
Route de récupération des doublons certains d'une notice.
Arguments de la route
id_conditor
(string) : Identifiant Conditor de la notice pour laquelle on cherche les doublons certains.- L'ajout du fragment d'URL
/and_self
permet d'intégrer les informations de la notice courante (id_conditor
) à la liste des doublons trouvés
Paramètres d'URL
-
scroll
(durationString) : Spécifie combien de temps une représentation consistante sera maintenue pour l'opération de scroll (max: 5m, unités: d|h|m|s|ms|micros|nanos). -
includes
(string) : Une liste de champs à extraire et à retourner dans la réponse. -
excludes
(string) : Une liste de champs à exclure de la réponse. -
page
(number) : le numéro de la page demandée (voir documentation complète) -
page_size
(number) : le nombre de résultats par page, doit être inférieur ou égal à 1000 -
q
(string) : UneQuery Lucene
, entourée de simple ou double guillements, qui permet de filtrer et trier les notices grâce à un score de pertinence. -
sort
(string) : Une expression permettant de trier une liste de résultats selon un ou plusieurs champs -
access_token
(string) : jeton d'identification JWT -
debug
: Activation du mode Debug
Retourne
(json) : Un tableau d'objets, représentant la liste des doublons, avec pour chacun d'entre eux la version JSON complète de la notice (y compris le champ teiBlob
qui est la version XML-TEI encodée en base 64)
Exemple
La requête suivante renvoie les 2 doublons certains de la notice d'id_conditor
"XztL5M8At6EdzDumYeJBXr2qg" :
.../records/XztL5M8At6EdzDumYeJBXr2qg/duplicates/and_self
Réponse de l'API :
[
{
"creationDate": "2019-01-14 15:40:58",
"title": {
"default": "3-Deazaneplanocin A (DZNep), an inhibitor of the histone methyltransferase EZH2, induces apoptosis and reduces cell migration in chondrosarcoma cells.",
....
},
"first3AuthorNames": "Girard Nicolas Bazille Céline Lhuissier Eva",
"idConditor": "ZF_tOY5Iym25kuFdzk3k9dgNZ",
"doi": "10.1371/journal.pone.0098176"
...
},
{
"creationDate": "2019-01-11 15:13:35",
"title": {
"default": "3-Deazaneplanocin A (DZNep), an Inhibitor of the Histone Methyltransferase EZH2, Induces Apoptosis and Reduces Cell Migration in Chondrosarcoma Cells",
...
},
"first3AuthorNames": "Girard Nicolas Bazille Celine Lhuissier Eva",
"idConditor": "JPSpXc5ueCubPvY_indVYiGXB",
"doi": "10.1371/journal.pone.0098176",
...
}
]
NB : Dans cet exemple, on a donc 3 notices représentant de manière certaine la même production. Leurs 3 identifiants sont XztL5M8At6EdzDumYeJBXr2qg
, ZF_tOY5Iym25kuFdzk3k9dgNZ
et JPSpXc5ueCubPvY_indVYiGXB
Route de récupération des doublons incertains d'une notice.
Arguments de la route
id_conditor
(string) : Identifiant Conditor de la notice pour laquelle on cherche les doublons incertains.- L'ajout du fragment d'URL
/and_self
permet d'intégrer les informations de la notice courante (id_conditor
) à la liste des doublons trouvés.
Paramètres d'URL
-
scroll
(durationString) : Spécifie combien de temps une représentation consistante sera maintenue pour l'opération de scroll (max: 5m, unités: d|h|m|s|ms|micros|nanos). -
includes
(string) : Une liste de champs à extraire et à retourner dans la réponse. -
excludes
(string) : Une liste de champs à exclure de la réponse. -
page
(number) : le numéro de la page demandée (voir documentation complète) -
page_size
(number) : le nombre de résultats par page, doit être inférieur ou égal à 1000 -
q
(string) : UneQuery Lucene
, entourée de simple ou double guillements, qui permet de filtrer et trier les notices grâce à un score de pertinence. -
sort
(string) : Une expression permettant de trier une liste de résultats selon un ou plusieurs champs -
access_token
(string) : jeton d'identification JWT -
debug
: Activation du mode Debug
Retourne
(json) : Un tableau d'objets, représentant la liste des doublons, avec pour chacun d'entre eux la version JSON complète de la notice (y compris le champ teiBlob
qui est la version XML-TEI encodée en base 64)
Exemple
La requête suivante renvoie les 2 doublons incertains de la notice d'id_conditor
"XztL5M8At6EdzDumYeJBXr2qg", plus la notice demandée elle-même :
.../records/LikaDFBCEMhCN7INEEl1ghA1G/near_duplicates/and_self
Réponse de l'API :
[
{
"creationDate": "2019-01-22 12:00:06",
"title": {
"default": "Acoustic Radiation",
...
},
"idConditor": "LikaDFBCEMhCN7INEEl1ghA1G"
...
},
{
"creationDate": "2019-01-22 11:56:29",
"title": {
"default": "Acoustic Waves, Propagation",
...
},
"idConditor": "vBqQsmyu6v7TWvaXuDHDR0EQx",
...
},
{
"creationDate": "2019-01-22 12:00:06",
"title": {
"default": "Acoustic Waves, Scattering",
...
},
"idConditor": "1asAH17m8wlzFXgKFh5moNlxI",
...
}
]
NB : Dans cet exemple, on a donc 3 notices représentant de manière incertaine la même production. Leurs 3 identifiants sont LikaDFBCEMhCN7INEEl1ghA1G
, vBqQsmyu6v7TWvaXuDHDR0EQx
et 1asAH17m8wlzFXgKFh5moNlxI