Post on 15-Apr-2017
Depozite digitale pentru instituții de cercetare și surse de informații privind Accesul
Deschis în România și Uniunea Europeană
IFIN HH, București, ianuarie, 2016
Kosson
Nicolaie Constantinescu, arhitect informațional
Clădirea 514, CERN
Ferma de servere din clădirea principală are 1450m2 și găzduiește un Tier 0 de prelucrare a datelor.
Tier O reprezintă însăși capacitatea de calcul al Centrului de date CERN
Capacitatea de calcul și stocare este dezvoltată pe 1200m2, până la 20000 de unități de calcul și stocare, 40 km de cablu, 3200 m de țează de oțel, 400.000 de ore de muncă. Este un Tier 0
http://home.cern/about/computing
Tier 0 distribuie datele brute și rezultatele reconstruite către structurile de calcul de tip Tier 1 și reprocesează datele atunci când LHC nu lucrează.
Tier 1 constă din 13 centre de prelucrare computerizată din întreaga lume îndeajuns de mari pentru a prelua (10Gb/s prin Rețeaua privată de fibră optică a LHC - LHCOPN) și stoca datele LHC. Au și rolul de a distribui date către Tier 2.
Tier 2 sunt universitățile și alte institute de știință care stochează îndeajuns de multe date și oferă îndeajuns de multă putere de prelucrare pentru sarcini de analiză specifice.
Tier 3 sunt clusterele locale din departamentul unui institut sau chiar un PC ca unitate individuală.
România participă prin Romanian Tier-2 Federation (7 instituții) din a cărei componență fac parte NIPNE și IFIN HH
Necesitatea unei infrastructuri care să asigure servicii de calitate
Softwarecu sursedeschise
StandardeDeschise
România: 12 instanțehttp://www.dspace.org/
http://files.eprints.org/
http://invenio.readthedocs.org
http://kosson.ro/know-how/212-oais-modelul-functional
REFERENCE MODEL FOR AN OPEN ARCHIVAL INFORMATION SYSTEM (OAIS)
http://ckan.org/
JSON
XML MARC21
ELI - THE EXTREME LIGHT INFRASTRUCTUREELI - THE EXTREME LIGHT INFRASTRUCTURE
THE ELI - NUCLEAR PHYSICS FACILITY THE ELI - NUCLEAR PHYSICS FACILITY
Biblioteca are un rol mult
mai activDate
Contribuțiilecercetătorilor
Servicii
Tehnologie
Management
Expertiză
Științe Deschise
AccesDeschis
DateDeschise
Cercetaredeschisă
reproductibilă
Însemnări de laborator/experiment
Instrumentede
evaluare
Politicilenecesare
deschiderii
Instrumentede lucrudeschise
Fluxuri de lucru ușor de reprodus
Instrumente licențiate deschis pentru cercetare
Metrici noi de evaluare
Folosirea datelor în formate standardizate
Îngemănarea politicilor guvernamentale cu cele ale Finanțatorilor cercetării și ale
Instituțiilor de cercetare
Depozite digitale deschise
Depozitul digital trebuie considerat parte a valorificări interne a rezultatelor de cercetare, a rețelei de referințe bibliografice locale, naționale și internaționale și o componentă activă a procesului de cercetare prin indicatorii și metricile pe care le poate genera.
Stabilirea autorității privind înregistrările
Atribuirea de identificatori pentru Cercetători – de tip ORCID,
Articole și/sau date – de tip DOI (Crossref)
Specialiștii bibliotecii stabilesc, creează, adoptă și atribuie vocabularele controlate
pentru facilitarea indexării și regăsirii
Stabilesc în consultare cu departamentele de cercetare grupurile și comunitățile
de date și informații din depozitul digital
Asigură stabilirea și întreținerea mecanismelor de prezervare digitală
a conținutului
Asigură compatibilitatea și schimbul de datecu instituții similare din țară și străinătate
Oferă metrici propriilor cercetători privindpropriile contribuții
Elaborează politicile privind- DMP – Data Management Plan
- TDM – Text and Data Mining
Elaborează și recomandăpoliticile privind Accesul Deschis de la
politică editorială până la licențele și termenii drepturilor de autor
Asigură migrarea conținutului din punct de vedere al formatelor bibliografice
Necesar:
● Mandatarea bibliotecii pentru a crea infrastructura● Un mandat pentru dezvoltarea unei politici interne privind publicarea rezultatelor folosind licențe deschise
● Interconectarea depozitului digital cu resursele la nivel european precum openaire.eu
● Instruirea prin intermediul bibliotecii a întregului personal privind publicarea deschisă a rezultatelor de cercetare
● Scanarea resurselor de cercetare care sunt cele mai importante și constituirea unei colecții care să acopere contribuțiile retroactiv.
● Pilotarea unui sistem de colectare a notelor de laborator în infrastructura bibliotecii.
O largă cunoaștere aîntregului ecosistem utilizat de cercetătorii proprii.
În acest moment, cercul de colaborare nu se mai oprește la nivelul institutului.
Datele și lucrările de cercetare sunt supuse atenției colegilor înainte de publicarea propriu-zisă
Plan de diseminare
Rezultate de cercetare
Plan de management
al datelorCE
RC
ETA
RE Decizie de
diseminare/distribuire
Decizie deexploatare/protejare
Publicații
Depozitareadatelor de cercetare
Patentare (sau alte forme de
protecție)
Accesare și Utilizare fără
taxare
Restricționarea Accesului și/sau a
utilizării
AD de aur
AD verde
http://ec.europa.eu/research/participants/data/ref/h2020/grants_manual/hi/oa_pilot/h2020-hi-oa-pilot-guide_en.pdf
http://access.okfn.org/2015/08/26/pasteur4oa-data-visualisations/
ROARMAP: http://roarmap.eprints.org/ (octombrie 2015)
www.pasteur4oa.eu
http://www.pasteur4oa.eu/sites/pasteur4oa/files/resource/Policy%20typology%20-FINAL.pdf
https://ec.europa.eu/commission/2014-2019/oettinger/blog/open-science-knowledge-and-data-driven-economy_en
Günther Oettinger
Comisar pentru Economia Digitală și Societate Digitală
Carlos MoedasComisar Cercetare, Știință și Inovare
Bruxelles, 22 iunie, 2015
Reprezintă o schimbare sistemică în modus operandi al științei și cercetării. Afectează întregul ciclu al cercetării și toți actorii săi, crește știința prin facilitarea unei mai mari transparențe, deschideri, interconectare, colaborare și refocalizează știința de la paradigma „publish or perish” (publică sau dispari) la perspectiva cunoașterii distribuite.
Despre ce este Despre ce este știința deschisă?știința deschisă?
Știința Deschisă descrie tranziția continuă a modului în care se face cercetarea, cercetătorii colaborează, cunoașterea este distribuită și știința este organizată.
https://ec.europa.eu/research/consultations/science-2.0/consultation_en.htm
http://ec.europa.eu/research/openscience/index.cfm
ȘTIINȚĂ DESCHISĂ
http://ec.europa.eu/research/conferences/2015/era-of-innovation/index.cfm
a new path for European a new path for European
research and innovation policyresearch and innovation policy
„Avem nevoie de mai mult acces deschis la rezultatele de cercetare și datele pe care se generează”http://europa.eu/rapid/press-release_SPEECH-15-5243_en.htm
Politica Olandeză privind Știința Deschisă
„În această politică, rezultatele de cercetare finanțate public, trebuie să fie liber disponibile fără taxare pentru toată lumea. Aceasta va fi o prioritate pe perioada Președenției Olandeze a Uniuni Europene în primul semestru al lui 2016”.
Sander Dekker
Secretar de Stat
Pentru Educație,
Cultură și
Știință
Olanda
https://ec.europa.eu/commission/2014-2019/moedas/announcements/commissioner-moedas-and-secretary-state-dekker-call-scientific-publishers-adapt-their-business_en
Declarație comună Bruxelles, 12 octombrie, 2015
OPENAIRE
Colaborareștiințifică deschisă
Știință Deschisă
24
Contextualizarea cercetării
Promovarea și alinierea politicilor privind AD
Infrastructuri naționale
interconectate
Legături către infrastructuri de date
pe domenii
O legăturăla inițiativeleguvernamentale pentru date deschise
O legătură către educația deschisă și mediile de învățare
Infrastructură participatorie
Cine suntem•Începând cu dec 2010
• OpenAIRE• OpenAIREplus• OpenAIRE2020• O entitate de sine stătătoare
din 2016
•Un consorțiu de 50 de
parteneri
perspective instituționale, naționale și internaționale privind politicile AD, e-infrastructuri
Experți în Accesul Deschis
• Elaborarea unor tehnologii pentru infrastructuri
• big data, linked data
Experți în domeniul informațiilor și informaticieni specializați
• Recomandări legale și pe politici
Experți zona legală
• Bune practici privind datele• Legături cu infrastructurile de date
Comunități de date
25
26
Depozite literatură
Reviste AD
Info finanțări
Validare
Curățare
Deduplicare
Inferring
Interconectare
Organizații
OrganizațiiProiecteProiecte
AutoriAutoriSeturi date
Seturi date
PublicațiiPublicații Furnizori date
Furnizori date
…
Monitorizare
Raportare
Evaluare
Impact
Clasificare
Clustering
Analiză
Sisteme CRIS
Un mini EU-CRIS system
Depozite date
Metadata
Text integral
Date deutilizare
Regăsire informație
Crowdsourcing
Zenodo
API-uri
Furnizori de date Platforma OpenAIRE Servicii
Rezultate: Un sistem de informare științific integrat
11.5 mil. De publicații unice
7 mil. autori590+ furnizori de date130 K publicații legate
de proiectele lor de la 3 agenții de finanțare 5.5 K seturi de date legate la publicații33 K de organizații
27
Rețeta
28
1. Date deschise…pentru distribuire, reutilizare, validare… de la sursă
2. Interoperabilitatea datelor furnizorilor…normalizare, îmbogățire, date interconectate
3. Servicii robuste oferite…pentru creșterea încrederii …Pentru preluare de la părți terțe
Procese de luare a
deciziilor transparente
și testate
1. Deschidere•Peisajul divers al Europei necesită sprijin la nivel local
•Practici diferite, mentalități diferite
29
O rețea de specialiști•33 de noduri expert în
toată Europa•Alinierea politicilor (AD)•Asistență tehnică• Instruire
• Un pas către
comunitatea
internațională prin COAR
2. Interoperabilitate•Ghiduri și standarde
•Ghiduri OpenAIRE guidelines pentru literatură, date, CRIS•Aliniere Globală și standarde (RDA, WDS, W3C, …)
•Folosirea schemelor de identificatori•Sinergii cu e-infrastructurile existente
•Vocabulare uniforme•Clasificare interdisciplinară•Multilingvism (ex., EUROVOC)
•Legături către alte domenii•Maparea modelelor de date (DCAT, LOM, …)•LOD – Date Deschise Interconectate
30
3. O infrastructură orientată pe servicii•Suport & Instruire
•Distribuirea rezultatelor științifice•Publicare AD & Depozitare•Validare și evidență
•Regăsirea informațiilor & Crowdsourcing
•Raportate & Monitorizare
•Analize pe date de utilizare
•…
31
Estimate AD privind FP7
36
FP7116.6K publicationsLinked to 11.5 K projects50% OA
0
5000
10000
15000
20000
25000
0
5000
10000
15000
20000
25000
O creștere a publicațiilor din proiectele FP7 în depozitele instituționale
38
7%
50%
29%
8%
5%
Distribution of publications by Journal Impact Factor value
<2 2 to 5 5 to 10 10 to 15 >15
Journal of antimicrobial chemotherapy (SJR: 2.4)
Nature (SJR: 21.3)
Journal of neuroscience (SJR: 5.8)
Human molecular genetics (SJR: 5.0)
Nature genetics (SJR: 24.1)
Proceedings of the National Academy of Sciences of the US (SJR: 7.0)
Nucleic acids research (SJR: 6.7)
Journal of biological chemistry (SJR: 3.4)
Antimicrobial agents and chemotherapy (SJR: 2.4)
PLoS One (SJR: 1.7)
0 100 200 300 400 500
147
147
154
162
185
186
197
218
233
1222
Number of publications by periodic: top 10
42%
35%
16%
7%
Distribution of publications by SJR value
<2 2 to 5 5 to 10 >10
Nature Medicine (SJR: 11.0)
Immunity (SJR: 14.3)
Nature Neuroscience (SJR: 11.9)
Neuron (SJR: 12.9)
Molecular Cell (SJR: 14.7)
Nature Methods (SJR: 10.7)
Science (SJR: 12.5)
Cell (SJR: 28.2)
Nature (SJR: 21.3)
Nature Genetics (SJR: 24.1)
020
4060
80100
120140
160180
200
40
41
41
47
48
75
75
77
147
185
Number of publications in periodics with SJR>10: top 10
Legături la baze de date
externeex., Scimago
Ce analizăm?•Mediul academic – cine ce face, care sunt tematicile
în top / trendurile•O cartografiere a autorilor, relațiilor, colaborărilor,
trendurilor, …
•Analiză pe rezultatele de cercetare pentru sprijinirea
deciziei politice•Comunități, corelații, domenii științifice• Identificarea lipsurilor și a tendințelor atipice•Corelare cu programele de finanțare• ...
40
1 2 3
From data acquisition to analysis
Get the data. Involve as many sources as possible.
Clean. Clean. Clean.
Link to many data sources & external dbs.
Classify content based on known classifications.
Cluster and classify based on statistical methodology – Find the unknown (trends)
Work with experts to give meaning to statistical output.
Visualize: use online tools to see different facets.
41
43
Corelații
Relation of HEALTH programme to other
FP7 programmes based on TDM/topic modelling
techniques.
www.openaire.eu@openaire_eufacebook.com/groups/openaire linkedin.com/groups/OpenAIRE-3893548
Thank you!
kosson@gmail
46
Vă mulțumesc!