Governance Framework of DataON
Roles and Functions of DataON Governance Organization(Research Data Sharing Center)
- ·DataON's policy establishment and governance response in general
- ·Establishing and operating a compliance environment for DataON
- ·Development and operation of DataON
- ·Collaboration of research data and policy and technical cooperation through cooperation with partners and committees
DataON's Decision-making Structure
- ·DataON operation department -> Consultative body(linked orgranzation and users) -> board of directors
Composition of the board of directors
- ·4 members from the Research Data Sharing Center(center head(1), team leader(2), and head of National Science and Technology Data Headquaters(1)
Roles and Responsibilities of the Board of Directors
- ·Dicision-making and budget control for DataON's operation management
- ·Overall responsibility for DataON
DataON and OAIS
DataON 서비스 운영/관리 정책 (Service Operation and Management Policies of DataON)
- 1. 회원 관리 정책 (Member Management Policy)
- 2. 데이터 공개범위 설정 정책 (Data Disclosure Scoping Policy)
- 3. 분석자원 할당 정책 (Data Analysis Resource Allocation Policy)
- 4. 데이터 등록/관리 정책 (Data Registration/Management Policy)
- 5. 데이터 수집/연계 정책 (Data Collection/Linkage Policy)
- 6. 기타 (Etc)
1. 회원관리 정책
- - 회원 유형은 시민(시민과학자), 연구자(학생,교수,연구원), 기관(기관관리자,공공기관,민간기업), 정부(정책입안자,펀더)로 구분
- - 회원 레벨은 비회원(대기회원포함), 일반회원, 특별회원으로 구분
- - 회원유형별 레벨 및 권한
- 회원 유형, 레벨 및 권한 상세
사용자 유형 | 개인 단위 사용자 기능 | 기관 단위 사용자 기능 | 관리자 기능 | |||||||||||
홈/소개/검색 | 드라이브 | 등록 | 분석 | 커뮤니티 | 현황 | API | 리포지토리 | 데이터 연계 |
포털 | 데이터 | 분석 | |||
회원 | 비회원/대기회원 | ● | ● | |||||||||||
일반회원 | ● | ● | ● | 신청 기능 |
● | ● | ||||||||
특별 회원 |
분석 | ● | ● | ● | ● | ● | ● | |||||||
기관 | ● | ● | ● | ● | ● | |||||||||
관리자 | 포털관리자 | ● | ● | ● | ● | ● | ● | ● | ||||||
데이터관리자 | ● | ● | ● | ● | ● | ● | ● | ● | ||||||
분석관리자 | ● | ● | ● | ● | ● | |||||||||
시스템관리자 | ● | ● | ● | ● | ● | ● | ● | ● | ● | ● | ● | ● |
2. 데이터 공개 및 라이선스 설정 정책
- - 메타데이터는 공개와 엠바고(최대 2년이내)으로 설정하고, 엠바고 경과후 자동 공개
- - 파일데이터는 공개, 비공개, 엠바고(최대 2년이내)로 설정하며, CC라이선스에 따라 라이선스 설정
- - 지정공개 : 엠바고 및 비공개 데이터에 대한 특정인 또는 그룹(커뮤니티)에 대한 공개 방안
- - 소프트웨어 라이선스는 소프트웨어의 경우에 설정하며, 저작권자가 라이선스 조건에 맞게 CC라이선스로 설정
- ※ 표준IDR의 공개범위 설정 현황 :
- - 메타데이터 원내 공개/원외 공개로 나누어 공개, 엠바고 설정 후 공개
- - 파일공개는 파일 공개(즉시 공개), 파일명 공개(엠바고 설정 후 공개), 파일 비공개
3. 분석자원 할당 정책
- - 본 정책은 분석자원 사용자에 대하여, 분석에 활용되는 자원할당에 관한 사항을 다룸.
- - 분석자원은 Front-end 로그인 자원과 Back-end 계산 자원 (GPU, CPU)으로 구성됨.
- - Hadoop, Spark 등의 부가 자원 (for multiple users)
- - 계산자원에 대한 사용기한 설정 (계산자원은 사용기한에만 활성화)
- - 로그인자원, 계산자원은 회원탈퇴와 동시에 자원 회수 (탈퇴시 공지(데이터 등 백업 – 사용자가 적절한 방법으로 백업))
- - DataON 홈페이지의 분석신청을 통해 데이터분석관리자의 승인을 거쳐 분석사용자로 인정
- - 분석사용자를 기본사용자(normal), 슈퍼사용자(super)로 구분
- - 분석사용자 모두는 승인과 함께 로그인 자원과 계산자원을 할당 받음.
- - 슈퍼사용자의 계산자원의 승격 및 부가자원에 대해 추가적인 신청서와 관리자의 승인 필요
- - 추가적인 사용자의 스토리지 요구에 대한 신청 및 승인 프로세스 구축 필요
- - 사용자의 기본환경에서 CPU와 GPU를 선택 기회 제공
- ※ 슈퍼컴퓨터, AWS 등의 자원은 플랫폼에서 개발 Roadmap에 따라 별도로 관리함.
구분 | 로그인 자원 | 계산자원 | 부가자원(Haboop, Spark) |
---|---|---|---|
기본사용자 |
CPU: 4(6)core, Memory:8(16)GB GPU(12GB, 15TP) Disk: 100GB |
로그인자원과 동일한 규모로 2개의 POD까지 가능 |
추가 신청, 관리자 승인 |
슈퍼사용자 |
4. 데이터 등록 정책
- - 연구데이터의 등록은 DataON 리포지터리에 메타데이터와 파일데이터를 등록함.
- - 등록자는 메타데이터를 충실히 작성하여 이용자들이 공유활용할 수 있도록 해야함.
5. 데이터 수집/연계 정책
- - 메타데이터 수집/연계 리포지토리 단위 : 기관, 부서 단위까지 제한
- - 등록데이터 : 메타데이터와 파일데이터는국가과학기술표준분류에 해당하는 데이터를 수집대상으로 함.
- - 연계 방식 :
- - 주 연계 프로토콜은 세계 표준 프로토콜 사용 (OAI-PMH)
- - OAI-PMH를 지원하지 않는 경우, 연계 대상 리포지토리의 API 사용
- - 외부 제공시에는 OAI-PMH를 통해 제공
- - 메타데이터 수집 주기 :
- - DataON Repo : 실시간 수집
- - 자동 수집 : 3개월마다 전체 데이터 수집
- - 수동 수집 : 6개월마다 전체 데이터 수집
- - 연계수집/중단 절차
- - 연계수집 개시 : 협의 → 수집연계협약서 → 수집 (데이터 관리/보존, 책임관계 등)
- - 연계수집 중단 : 협의 → 수집연계중단합의서 → 중단 (데이터보존 여부 등)
6. 기타
- - IDR 호스팅 서비스는 반드시 메타데이터를 공개한다는 전제하에 호스팅 서비스를 제공
연계 및 서비스 협약서(안)
Linkage and service agreement with DataON (draft)
The attached file is an agreement written to link with DataON.
연구데이터 관리 가이드라인 (Research Data Management Guidelines)
-
연구데이터 관리 가이드라인 (Research Data Management Guidelines)
국가연구개발사업에서 생산된 연구데이터의 수집,관리, 공유, 활용 기준 마련을 위한 가이드라인입니다. -
연구데이터 보존 가이드라인 (Research Data Preservation Guidelines)
내구성 있는 형식을 선택하고, 파일을 로컬 아카이빙하고, 데이터 파일을 데이터 리포지터리에 제출하여 데이터 파일을 장기간 보존하는 절차를 따르는 위해 작성된 가이드라인입니다. -
연구데이터 관리 계획(DMP)가이드라인 (DMP(Data Management Plan) Guidelines)
국가연구개발사업에서 생산되는 연구데이터에 대한 데이터관리계획(Data Management Plan, DMP)의 작성 및 점검 기준 마련을 위한 가이드라인입니다. -
연구데이터 라이선스 가이드라인 (Research Data License Guidelines)
연구데이터 공유‧활용 시 적용 가능한 연구데이터 라이선스와 연구데이터 이용표준협약(안)을 제시합니다. -
연구데이터 윤리 가이드라인 (Research Data Ethical Guidelines)
연구데이터 생산·관리·공유 시 발생할 윤리적 문제 발생을 방지하기 위한 지침입니다. -
연구데이터 인용과 활용지표 가이드라인 (Guidelines for Indicators of Citation and Utilization of Research Data)
연구데이터 활용 성과 인정을 위한 데이터 인용 방안 및 활용 실적 기준을 마련하기 위한 가이드라인입니다. -
연구데이터 관리 규정(안) (Research Data Management Regulations(draft))
연구데이터 관리 규정 제정시 활용할 수 있는 관리 규정 예시입니다. -
연구데이터 리포지터리 활용 지침서 (Research Data Repository Utilization Guidelines)
한국과학기술정보연구원에서 개발한 연구데이터리포지터리 NaRDA에 대한 소개 및 활용 방안에 대하여 기술되어 있습니다. -
메타데이터 설계지침서 (Metadata Design Guidelines)
연구데이터의 메타데이터 스키마 설계 시 활용할 수 있는 지침서입니다.
DataON의 백업,복구 및 보존 지침 (Backup, Recovery, and Preservation Guidelines for DataON)
1. 백업 및 복구
DataON의 백업 시스템은 Lustre와 NAS로 구성되며, 서비스 스토리지로부터 주기적으로 백업된 데이터를 백업시스템에 저장하여 백업을 수행함.
- 1) 백업 정책 및 지침
- - 백업대상 : DataON의 연구데이터, 데이터베이스 및 사용자 데이터파일 에 대한 백업 수행
- - 백업 주기 :
- - 사용자 데이터파일(사용자가 저장한 파일)백업 : 일(Sun)
- - 데이터베이스(관리용 데이터 및 메타데이터 등) 백업 : 월(Mon), 수(Wed), 금(Fri)
- - 사용자 데이터, 데이터베이스 및 연구데이터(파일) 전체 백업 : 토(Sat)
- 2) 복구 정책 및 지침
- - 시스템 소프트웨어 및 응용 소프트웨어는 로컬 GIT 리포지터리로 부터 복구 수행
- - 연구데이터, 데이터베이스, 사용자 데이터파일에 대한 복구는 백업장치에 저장된 데이터로 복구 수행
- - 백업된 데이터가 문제가 발생하였을 경우, 소산지의 테이프 백업을 통한 복구 수행
2. 아카이빙 및 보존 (Archiving and Preservation)
- - 데이터의 보존을 목적으로 주기적으로 데이터를 아카이빙(자기테이프)하여 보존한다.
- - Archiving and Preservation 방법 : 테이프 백업을 통하여 백업테이프를 원격지에 소산 및 아카이빙하여 보존 (quarterly)
- - Archiving 테이프의 보존 기한은 최소 5년이상으로 보존한다.
3. 재해복구
- - 기존시스템 사용불가의 경우 : 시스템 인프라의 신규 도입 및 설치
- - 소프트웨어는 프로젝트 및 문서 레지스트리의 문서를 기준으로 설치 및 환경 설정
- - 소스코드는 소스코드 레지스트리에 저장된 소스코드와 문서를 기준으로 재 배포
- - 1차적으로는 백업 스토리지에 저장된 백업본을 통하여 복구
- - 2차적으로 원격지에 보존된 자기 테이프를 통하여 데이터 복구