본문 바로가기
온라인으로 돈버는 방법

데이터라벨링으로 부수입 올리기

by 각종 잡상식 지식 모음 2023. 4. 5.
반응형

[사전공개] 2023년 인공지능 학습용 데이터 구축 지원사업 공고서

2023.03.31 조회수 7127송종빈 AI데이터2팀

2023년_인공지능_학습용_데이터_구축_지원사업_공고(사전공개).hwp

한국지능정보사회진흥원에서는 사업관리기본운영규칙(2022.12.21) 제8조(제안요청서 사전공개)에 의거, 다음과 같이 공고서를 확정 전에 공개하오니 참고하시기 바랍니다.

단, 공고서를 검토/조정하는 과정에서 사업범위, 예산, 일정 등의 내용은 본 공고시, 변경될 수 있으니 유의하시기 바랍니다.

 

[사전공개 대상사업]

사 업 명 : 2023년 인공지능 학습용 데이터 구축 지원사업

o 공개기간 : 2023년 3월 31일(금) ~ 4월 5일(수)

 

※ 첨부된 공고서의 사업범위 및 내용, 사업자 선정기준에 참여기회 등을 제한하는 내용이 있을 경우,

이메일(aihub@nia.or.kr)로 의견 주시면 참고하도록 하겠습니다. (의견 송부 시, 성함 및 연락처를 남겨주시기 바랍니다.)

※ 본 사전공개는 정식 공고가 아니므로 제안서 접수 마감일, 제안서 작성서식 등은 반드시 추후 게재될 본 공고를 통해 확인하시기 바랍니다.

(공고 내용에 대한 문의 방법은 추후 본 공고시 별도 공지 예정입니다.)

1

지원목적 및 배경

□ 지원배경

ㅇ 인공지능 생태계 조성 및 일상생활 곳곳으로 확산하기 위해 다양한 분야의 대규모 학습용 데이터 수집·공유 필

- 인공지능 산업 고도화는 인공지능 모델의 참신함과 정확성 등을 비롯하여 데이터의 다양성과 규모에 의존

※ 인공지능 서비스 개발에서 데이터 구축에 자원의 80%가 투입

 

- 국내 기업·기관 등의 인공지능 학습용 데이터 구축은 많은 시간과 비용이 소요되며, 인공지능 도입·개발에 진입장벽으로 작용

※ 인공지능 도입의 장애물(‘21, KISDI) : 기계학습용 데이터 부족(24.2%) 등

 

ㅇ 최근 ChatGPT등 초거대AI 등장에 따라 환경변화에 선제적 대응을 위해 국가적 차원의 고품질·대규모 데이터 구축 지원 필요성 증대

 

□ 지원목적

 

ㅇ 디지털 대전환의 핵심 자원인 인공지능 학습용 데이터 구축·개방을 통해 인공지능 생태계 조성 및 일상화 실현

 

- 모든 분야의 인공지능 도입 확산과 기술 발전을 선도할 수 있는 대규모 데이터 확보 및 민간 데이터 구축 사업 촉진

- 체계적인 데이터 자원을 확보하여 인공지능 데이터 부족 문제를 해소하고 국내 기업·기관 등의 인공지능 도입·개발에 대한 진입장벽 완화

- 고품질·대규모 학습용 데이터를 구축·개방하여 초거대AI 환경조성 등을 통해 세계 최고의 AI강국 실현 도모

⇨ 디지털 대전환의 핵심 자원인 인공지능 학습용 데이터 구축ㆍ개방을 통한 인공지능 산업 고도화 및 디지털 플랫폼 정부 기반 제공
2

지원사업 주요내용

 

□ 공고 및 접수기간 : 본 공고 확인 요망

 

□ 지원 규모 : ’23년 총 2,188억원

 

□ 지원기간 : 협약일로부터 ~ ’23. 12. 31.

 

※ 과제의 협약 시작일은 협약체결 완료 월의 1일로 소급 적용하여 협약체결 예정

 

□ 지원대상 : 기업, 대학, 공공기관, 정부·지자체, 협회, 개인사업자 등

 

□ 지원규모 : 정부지원금 13.5억원~51억원 수준(과제목록 6페이지 참조)

 

※ 정부 지원금은 과제조정위원회 심의ㆍ조정에 따라 일부 조정될 수 있음

 

ㅇ (지정공모) 94개 분야(118종 데이터) / 94개 수행기관 선정․지원

ㅇ (자유공모) 6개 분야(20종 데이터) / 20개 수행기관 선정․지원

 

※ 2023년도 예산 상황 변화에 따라 선정 규모 및 평가 일정 등은 변경될 수 있음

▸ (수행기관) 주관기관 + 참여기관
▸ (주관기관) 과제를 주관하여 수행하는 대표 기관(기업)
▸ (참여기관) 주관기관과 공동으로 해당 과제에 참여하여 사업을 수행하는 기관(기업)
▸ (수요기관) 과제에 참여하여 과제수행의 결과 발생하는 유‧무형의 결과물 또는 서비스 수요자로서 이용하거나 활용하는 기관(기업)으로 정부출연금 지원 없이 과제에 참여

 

□ 지원조건

 

ㅇ 인공지능 학습데이터를 활용하는 전문기업을 포함하여 인공지능 학습용 데이터 구축 역량을 갖춘 2개 이상(수요기관 제외)의 기업ㆍ기관이 컨소시엄 형태로 수행기관 구성 필수

 

ㅇ 주관기관 또는 참여기관 자격으로 최대 5개 분야까지 지원 가능하며 동일 분야 내 주관기관 또는 참여기관으로 중복지원은 불가

 

※ 1개 기업‧기관은 총 5개 분야에 지원 가능하나 주관기관 자격으로는 최대 3개까지만 지원 가능(예시: 주관기관 자격 3개, 참여기관 자격 2개 지원 가능 / 참여기관 자격 5개 지원 가능 / 주관기관 자격 4개, 참여기관 자격 1개로는 지원 불가)

 

※ 동일 기관이 동일 분야(예: 1. 라이브 스트리밍 영상 통번역 데이터)에 주관기관으로 지원 후 다른 컨소시엄을 구성하여 주관기관 또는 참여기관으로 재차 지원 불가

 

※ 주관기관 또는 참여기관 자격으로 다수 분야에 참여 시 참여 한도인 총 5개 분야(주관기관 자격으로는 총 3개 분야) 접수 완료 기준 순으로 인정하며, 그 이후 접수된 지원은 모두 불인정(제안서 접수시스템의 최종 제안서 제출 송신시간 기준)

 

ㅇ 지역특화영역은 지방자치단체(광역 및 기초) 참여가 필수이고 공고일 기준 해당 지방자치단체에 소재지가 등록되어있는 기업ㆍ기관이 주관기관 또는 참여기관으로 참여 필수

 

※ 지방자치단체는 주관, 참여, 수요기관 중에서 선택하여 참여

※ 수요기관은 동일 분야에 중복하여 참여 가능

 

- 지역특화영역은 기존 산업 지능화, SOC 지능화, 생활환경‧안전 재난 고도화의 3개 분야에 데이터 구축 주제를 자유롭게 선정하여 지원

< 신청 시 유의사항 >
대학은 교내 다수 연구실 등이 동일 분야에 주관 또는 참여기관으로 중복참여 하거나 총 5개 분야(주관기관 자격으로는 총 3개) 초과 신청에 주의
- 대학은 산학협력단 명의 신청이 원칙이고 산학협력단이 없는 대학만 학교법인 명의로 신청
동일 분야 내 중복 지원 또는 최대 지원가능 분야 수를 초과한 기업・기관이 주관 기관으로 참여한 경우 수행기관 공모신청 전체가 무효이며, 참여기관으로 참여한 경우 해당 기업・기관에 대해서만 무효로 처리 하고 그 참여 비율(예산분담비율) 만큼 평가시 감점
인공지능 학습용데이터품질검증전문기관으로 지정된 정보통신기술협회(TTA)는 참여 불가
총괄책임자의 경우 중복투입이 불가하며, 참여인력의 경우 중복투입이 가능하나 한국지능정보사회진흥원의 타사업 및 외부기관의 사업을 포함하여 참여율 100% 초과 불가
구체적인 사유 없이 수행기관 총괄책임자 변경 불가
▸ 전담기관(NIA)의 사업수행 중 개인정보보호법을 위반하여 전담기관(NIA) 사업 참여 제재 처분 중인 사업자는 지원불가

 

□ 민간부담금 부담

 

국가연구개발혁신법 시행령 제19조(연구개발비의 지원과 부담)에 따라 수행기관은 민간부담금을 부담하되, 지원금액 기준은 코로나19로 인한 산업현장의 어려움 해소를 위한 ‘감염병 대응 국가연구개발사업 지원 지침 연장(’22.12월)’ 기준을 적용​

< 정부지원금 지원기준 및 민간부담금 중 현금부담 기준 >
▸ 정부지원금 지원기준
중소기업인 경우
중견기업인 경우
공기업, 대기업인 경우
해당 수행기관
총 사업비의 80% 이하
해당 수행기관
총 사업비의 70% 이하
해당 수행기관
총 사업비의 50% 이하
▸ 민간부담금 중 현금부담 기준
중소기업인 경우
중견기업인 경우
공기업, 대기업인 경우
해당 수행기관
민간부담금의 10% 이상
해당 수행기관 민간부담금의 10% 이상
해당 수행기관 민간부담금의 15% 이상
※ 비영리 기관(대학, 공공기관, 정부·지자체, 협회 등)의 경우 정부지원금 100% 지원

 

□ 정부 지원금 지급

 

ㅇ 정부 지원금은 수행기관에 참여한 모든 주관・참여기관에 분배됨을 원칙으로 함

ㅇ 정부지원금은 과제수행에 지장이 없는 범위 내에서 분할 지급

ㅇ 예산 등 정책상의 변동이 발생할 경우 협약금액이 조정(최대 25%내외)될 수 있으며, 이 경우 과제조정을 통해 변동된 협약금액에 따라 구축량 등을 조정할 수 있음

□ 관련 규정

 

ㅇ 정보통신진흥기금 운용·관리규정(과학기술정보통신부고시)

 

ㅇ 기금사업 협약체결 및 사업비 관리 등에 관한 지침(과학기술정보통신부훈령)

※ (주의요망) 9조 2항을 참고하여 평가배제(완전자본잠식 등) 대상여부를 반드시 확인

 

ㅇ ICT 예산 정책 협의체 운영 등에 관한 지침(과학기술정보통신부훈령)

 

ㅇ 기금 사업비 산정 및 정산 등에 관한 지침(과학기술정보통신부훈령)

 

ㅇ 기금사업 결과 평가 등에 관한 지침(과학기술정보통신부훈령)

 

ㅇ 기금사업 성과관리 및 활용 등에 관한 지침(과학기술정보통신부훈령)

 

ㅇ 기금사업 수행상황 및 정산 보고 등에 관한 지침(과학기술정보통신부훈령)

 

ㅇ 기금사업 점검계획 등에 관한 지침(과학기술정보통신부훈령)

 

ㅇ 한국지능정보사회진흥원 ICT 기금사업 및 연구개발사업 관리지침

 

※ (주의요망) ICT기금사업 및 연구개발사업 관리지침 제18조 감점기준 확인

 

ㅇ 한국지능정보사회진흥원 참여기관 선정평가 세부운영지침

 

※ 상기 규정 등은 과학기술정보통신부 정보통신신흥기금 운용‧관리 규정 및 부속 지침의 제개정시 해당 지침으로 대체하여 적용

 

 

< 지원 과제 목록 >

󰋮 지정공모 94개 분야(118종 데이터) 세부적인 요구사항은 ‘붙임’ 확인(33페이지)
영역
연번
분 야
데이터
(종)
수행
기관
예산*
(억원)
요구사항
(페이지)
한국어
1
라이브 스트리밍 영상 통번역 데이터
3
1
42
37
한국어
2
다국어 일상대화 실시간 통번역 데이터
1
1
14
43
한국어
3
국제 학술회의용 전문분야 한영/영한 통번역 데이터
1
1
14
45
한국어
4
K-콘텐츠 멀티턴 한-영 다국어 페르소나 데이터
1
1
14
47
한국어
5
다국어 기계번역 치명적 오류 탐지 및 교정 데이터
1
1
14
49
한국어
6
다국어 번역 품질 평가 데이터
1
1
14
53
한국어
7
분야별 한국어 멀티세션 데이터
3
1
42
56
한국어
8
한국어 SNS 멀티턴 대화 데이터
1
1
14
62
한국어/
문화관광
9
동화 데이터
3
1
45**
64
한국어
10
다양한 소음원에서의 Ground Truth 지식 정보 데이터
1
1
14
71
한국어
11
한국어 텍스트-비디오-사운드 데이터
1
1
17
73
한국어
12
음성인식에 의한 영상 요약 데이터
1
1
14
75
한국어
13
한국어 지식그래프 및 다중 이벤트 추출 데이터
2
1
28
78
한국어
14
AI 응답 결과에 대한 품질 평가 데이터
1
1
14
83
한국어
15
법률안 검토 보고서 및 국회 회의록 데이터
2
1
28
85
한국어
16
아동·청소년 상담 데이터
1
1
17
89
한국어
17
고령자 근현대 경험 기반 스토리 구술 데이터
1
1
14
92
영상이미지
18
한국인 얼굴 3D 데이터
2
1
34
95
영상이미지
19
한국인 피부상태 측정 데이터
1
1
17
99
영상이미지
20
물체 조작 손 동작 3D 데이터
1
1
17
101
영상이미지
21
한국인 전신 및 포즈 데이터
1
1
17
103
영상이미지
22
표/차트 이미지 해석 데이터
2
1
34
105
영상이미지
23
다중 언어 OCR 데이터
1
1
17
109
영상이미지
24
한국어 GQA 데이터
1
1
17
111
영상이미지
25
한국형 텍스트-3D 객체 쌍 데이터
1
1
17
113
영상이미지
26
한국 전통 수묵 채색화 제작 데이터
1
1
17
115
영상이미지
27
의류 스케치-패턴 도면 쌍 데이터
1
1
17
117
영상이미지
28
음식 3D 데이터
1
1
17
119
영상이미지
29
가상 실내 공간 3D 합성 데이터
1
1
17
121
영상이미지
30
교량 3D 외관점검 영상 데이터
1
1
17
124
영상이미지
31
낙상사고 위험동작 영상-센서 쌍 데이터
1
1
17
126
영상이미지
32
스트레스 상황 바이오 이미지 복합 데이터
1
1
17
128
영상이미지
33
대용량 동영상 콘텐츠 데이터 (고도화)
1
1
13.5
130
헬스케어
34
혈관 데이터
2
1
34
132
헬스케어
35
관절 및 관절염 데이터
3
1
51
136
헬스케어
36
난소 및 배아 데이터
2
1
34
142
헬스케어
37
내시경 이미지 합성데이터
1
1
17
146
헬스케어
38
구강 이미지 합성데이터
1
1
17
148
헬스케어
39
노인 정신건강 영상 데이터
1
1
17
150
헬스케어
40
뇌졸중 경과관찰 데이터
1
1
17
152
헬스케어
41
비뇨기계 암 병리이미지 데이터
1
1
17
154
헬스케어
42
약물유도 수면내시경 영상 데이터
1
1
17
156
교통물류
43
열화상 카메라 융합 자율주행 데이터
1
1
17
158
교통물류
44
생활도로 객체인식 자율주행 데이터
1
1
17
160
교통물류
45
전국 도로시설물 영상정보 데이터
1
1
17
162
교통물류
46
고해상도 도로노면 이미지 데이터
1
1
17
164
교통물류
47
특이 도로 환경 주행 데이터 (고도화)
- 비포장 도로환경 주행 데이터
1
1
17
167
교통물류
48
과수원 내 로봇 주행 데이터
2
1
34
169
농축수산
49
식용곤충 사육 자동화 데이터
1
1
17
173
농축수산
50
원예식물(화분류) 물주기(수분공급 주기) 생육데이터
1
1
17
175
농축수산
51
국내 재배 아열대·열대 작물 질병/해충 데이터
1
1
17
177
농축수산
52
잔디 생육환경 다분광 이미지 데이터
1
1
17
179
농축수산
53
꿀벌 질병 진단 이미지 데이터
1
1
17
181
농축수산
54
말(馬) 부위 식별 및 이상상태 진단 이미지 데이터
1
1
17
183
농축수산
55
해조류 및 저서물질 초분광 영상 데이터
1
1
17
185
농축수산
56
지능형 스마트 미꾸리 종자생산 시스템 및 양식 데이터
1
1
17
187
농축수산
57
해파리 초기유생 데이터
1
1
17
189
농축수산
58
유용 식물 유전체 데이터
2
1
34
191
재난안전환경
59
건물 균열 탐지 이미지 (고도화)
- SOC 시설물 균열패턴 이미지 데이터
1
1
17
195
재난안전환경
60
도로 지상 시설물 안전 관리를 위한 GPR 데이터
1
1
17
197
재난안전환경
61
제조시설 안전 데이터
2
1
34
199
재난안전환경
62
식생탄소 포집 및 탄소흡수원 데이터
2
1
34
203
재난안전환경
63
공사현장 안전 데이터
2
1
34
207
재난안전환경
64
수변구역 변화 탐지 데이터
2
1
34
211
재난안전환경
65
어린이 보호구역 내 등하교 및 시설물 영상 데이터
1
1
17
217
재난안전환경
66
놀이기구 및 시설 이용자 위험 상황 인식 데이터
1
1
17
220
재난안전환경
67
화학물질(유전독성) 유해성 예측 데이터
1
1
17
222
재난안전환경
68
위급상황 음성/음향 (고도화)
- 119 지능형 신고접수 음성 인식 데이터
1
1
13.5
224
재난안전환경
69
화재 발생 예측 영상 (고도화)
- 영상 기반 화재 감시 및 발생 위치 탐지 데이터
1
1
17
226
재난안전환경
70
산업 설비 전기 화재 사고 예방 부분방전 데이터
1
1
17
229
재난안전환경
71
기반암 시추 시료를 이용한 암반 등급 분류 데이터
1
1
17
232
재난안전환경
72
하천 유입 농축산계 비점오염원 이미지 데이터
1
1
17
234
문화관광
73
전통 한복 3D 데이터
1
1
17
237
문화관광
74
관광 특화 말뭉치 데이터
1
1
14
239
문화관광
75
만화·웹툰 데이터
2
1
34
241
문화관광
76
탈춤 동작 데이터
1
1
17
245
문화관광
77
한국 대중음악 루프 사운드 생성 데이터
1
1
17
247
문화관광
78
관광분야 이미지-텍스트 쌍 데이터
1
1
17
249
스포츠
79
한국 씨름 동작 데이터
1
1
17
251
스포츠
80
야구 주요 규칙 판정 영상 데이터
1
1
17
253
제조
81
건설기계 무인 운행 데이터
1
1
17
255
제조
82
배터리 불량 이미지 데이터
1
1
17
257
제조
83
부품 품질 검사 영상 데이터(선박·해양플랜드) (고도화)
- LNG탱크 품질 검사 영상 데이터
1
1
17
259
로보틱스
84
물품 적재 및 로봇 행동 데이터
2
1
34
261
로보틱스
85
로봇 관점 주행 영상 (고도화)
- 소셜 내비게이션 로봇 주행
1
1
17
265
교육
86
진로문장완성검사 텍스트 데이터
1
1
17
268
교육
87
학습태도 및 성향 관찰 데이터
1
1
17
270
교육
88
수학 문제 데이터
2
1
34
272
교육
89
공적말하기 실습 및 평가 데이터
1
1
17
276
법률
90
법률 정보 및 다국어 번역 데이터
2
1
28
278
법률
91
법률/규정 텍스트 분석 데이터 (고도화)
- 상황에 따른 판례 데이터
1
1
14
282
금융
92
금융 분야 다국어 병렬 말뭉치 데이터
1
1
14
284
금융
93
금융 합성데이터
1
1
17
286
지식재산
94
한-중/한-일 특허 및 기술과학 분야 병렬 말뭉치 데이터
1
1
14
288

 

 

* 현재 제시된 예산은 최대 범위이며, 과제조정위원회 등을 통해 조정될 수 있음

** 분야9 동화 데이터의 세부 데이터9-1, 9-3은 각 14억(최대), 데이터 9-2는 17억 원(최대)임

 

※ 2023년도 예산 상황 변화에 따라 선정 규모 및 평가 일정 등은 변경될 수 있음

 

󰋮 자유공모 4개 영역 6개 분야(20종 데이터)
영역
연번
분 야
데이터
수행
기관
예산*
(억원)
초거대
AI
일반
말뭉치
95
초거대AI 학습을 위한 말뭉치 데이터
* AI최신기술인 초거대 AI 언어모델 및 응용서비스 개발에 필수적인 대량의 말뭉치 데이터 구축
※ 각 원천데이터 구축량 2억 토큰(어절) 이상
3종
내외
3개
내외
각14
다국어 말뭉치
(해외진출지원)
96
해외 인공지능 서비스 시장진출 지원을 위한
해외 언어 원천의 말뭉치 데이터
※ 각 원천데이터 구축량 2억 토큰(어절) 이상
※ 영어 제외
3종
내외
3개
내외
각14
일반
지역특화
97
기존 산업 지능화 데이터
* 주요 전통 산업(예: 조선, 기계, 철강, 섬유, 농업, 자동차 등)에 지능화 기술 도입 및 디지털 전환
4종
내외
4개
내외
각13.5
98
SOC 지능화 데이터
* 국가 주요 SOC(예: 전기, 수도, 도로, 터널 등)의 지능화 기술 개발
4종
내외
4개
내외
99
생활환경‧안전재난 고도화 데이터
* 국민의 생활환경 개선 및 주요 재난, 안전(산불, 화재, 홍수 등) 대응을 위한 지능화 서비스 개발
4종
내외
4개
내외
자유주제
100
인공지능 기술‧산업 혁신에 필요한 데이터
2종
내외
2개
내외
각13.5

※ 현재 제시된 예산은 최대 범위이며, 과제조정위원회 등을 통해 조정될 수 있음

 

※ 자유 공모의 6개 분야(95~100)에 동일한 데이터 구축 내용으로 동시에 지원할 수 없으며 만약 확인될 경우 해당 참여신청 건은 모두 무효 처리됨

3

수행기관 선정방안 및 평가기준 등

 

□ 수행기관 선정 및 사업계획서 평가

 

ㅇ (사전검토) 사업수행계획서, 제출서류 및 자격요건 사전검토

 

- 기한 내 접수 완료된 과제에 대해 사업수행계획서의 구비요건, 자격요건 등을 제출서류를 통해 사전검토하고 평가 대상 선정

 

※ 사전검토는 「기금사업 협약체결 및 사업비 관리 등에 관한 지침」 제9조를 기준으로 실시

 

※ 단, 비영리 기관 및 공기업(공사)은 제9조 2항을 적용하지 아니함

 

ㅇ (사업계획서 평가) 평가위원회의 구성 및 운영은 한국지능정보사회진흥원(이하 지능정보원) 관련 규정에 따라 시행

 

- 평가위원은 수행기관의 사업계획서를 사전에 검토하고 피평가자의 프레젠테이션 발표 및 질의응답을 통해 평가(발표 : 20분, 질의응답 : 30분)

 

※ 발표 시간은 수행기관 접수 결과에 따라 일부 조정 될 수 있음

 

- 수행기관 총괄책임자가 발표하는 것이 원칙이며 총괄책임자 발표가 불가능하다고 평가위원회에서 인정할 경우 서면으로 평가

 

- 평가점수 산출은 위원별 평가점수 중 최고․최저 점수를 제외한 나머지 점수를 평균하며 소수점 넷째 자리까지 산정(다섯째 자리에서 반올림)

 

※ 동점자 발생 시 평가표의 ‘데이터 구축 내용의 적합성 항목’의 배점 상위자, ‘품질목표 및 품질관리방안의 적정성’의 배점 상위자를 차례대로 우선 선정

 

- 발표자료는 수행계획서 접수 시 제출한 자료 범위 내에서 활용 가능

 

※ 제안서 접수기간 마감 후, 자료 수정제출, 추가 제출, 동영상 사용 불가

 

ㅇ (수행기관 선정) 평가결과 적합(70점 이상)인 과제에 대해 평가점수 순으로 순위를 부여하고 우수 수행기관을 선정 후 심의‧조정 실시

 

※ 사업수행계획서에 제안 분야 번호(연번) 및 분야명 반드시 명기

 

- 지정공모 94개는 해당 분야에 신청한 수행기관 중 최고 평가점수를 획득한 1개 수행기관을 우선지원 대상 수행기관으로 선정

 

- 자유공모 중 초거대AI 영역은 2개의 분야에서 상위 평가점수를 획득한 각 분야당 3개 내외 수행기관을 선정

 

※ 초거대AI 영역 2개 분야 : 95.초거대AI 학습을 위한 말뭉치 데이터, 96.해외언어 원천의 말뭉치 데이터

 

- 자유공모 중 지역특화 영역은 3개의 분야에서 상위 평가점수를 획득한 각 분야당 4개 내외 수행기관을 선정

 

※ 지역특화 영역 3개 분야 : 97.기존 산업 지능화, 98.SOC지능화, 99.생활환경‧안전 재난 고도화

 

- 단, 지역특화 영역의 3개 분야는 5개 권역별로 해당 권역에 속한 지방자치단체가 참여하는 과제를 각 분야당 최대 2개로 제한함

 

※ 5개 권역 : 수도권(서울, 인천, 경기), 경상권(부산, 대구, 울산, 경남, 경북), 전라권(광주, 전남, 전북), 충청권(대전, 세종, 충남, 충북), 기타(강원, 제주)

 

※ 예시) 기존산업 지능화 분야에서 수도권역의 지자체는 최대 2개까지 선정이 가능하고, SOC 지능화 분야에서는 수도권역의 자자체가 최대 2개까지 선정 가능

 

- 자유공모 중 자유주제영역은 해당 분야에 신청한 수행기관 중 상위 평가점수를 획득한 2개 내외의 수행기관을 선정

 

o (수행기관 선정 수 조정) 자유공모 4개 영역 내에서 영역별 또는 분야별 수행기관의 지원 접수 현황, 지원예산, 수행기관 선정 평가결과 등에 따라 최종 수행기관 선정 수를 조정할 수 있음

 

 

□ 평가 기준

구분
평가항목 및 기준
배점
과제 목표의
타당성
(9)
o 과제추진계획과 사업목표(AI 산업육성 등)와의 일치성
5
o 사업추진을 위한 체계 및 절차, 일정 계획의 타당성
4
데이터 구축
내용의 적합성
(33)
o 인공지능 학습용 데이터 확보 계획의 적정성
- 원천 데이터 확보 방안의 타당성 및 적극성
- 법적 현안에 대한 사전검토 및 대응방안 적정성
- 특성에 맞는 신기술 활용 등을 통한 효율적 구축 노력
8
o 원천 데이터 등의 확보에 대한 사전준비 충분성
- 데이터의 권리확보를 위한 계약, 협약, MOU 등 관련 사전 준비의 적정성(계약서, 협약서, 심의결과 등 증빙 확인)
- 데이터 수집 등을 위한 장비 확보의 충분성
- 세부 데이터별 포트폴리오(샘플 데이터) 적정성
9
o 인공지능 학습용 데이터 구축 방안의 우수성
- 데이터 구축 성과 목표(수량 등)의 적정성
- 데이터의 구축 공정(획득/수집, 정제, 가공) 단계의 절차 및 방법 적정성
10
o 인공지능 학습용 데이터 개인정보 조치 방안 적정성
- 개인정보 동의 등 개인정보 이용 및 권리 확보의 적정성
- 개인정보 비식별화 기술 및 방법의 우수성
6
품질목표 및 품질관리방안의 적정성
(21)
o 인공지능 학습용 데이터 품질목표 설정 및 관리체계 구축 적절성
- 인공지능 학습용 데이터 품질지표 및 목표의 타당성
- 수행기관의 인공지능 학습용 데이터 품질관리 역량
- 수행기관의 품질관리체계(조직/인력/절차/품질기준/도구 등) 준비도 및 구체성
9
o 인공지능 학습용 데이터 품질관리 방안의 적정성
- 인공지능 학습용 데이터의 품질관리(품질검사 등) 및 확보 방안의 구체성
12
인공지능 기술역량
(11)
o 인공지능 학습용 데이터 응용서비스 개발 우수성
- 수행기관 등의 데이터 활용 AI기술구현 및 모델 개발역량, 실현 가능성, 성능목표의 적정성
6
o 인공지능 학습용 데이터 저작도구 활용 적정성
- 저작도구 확보방안/저작도구 활용 방법 적정성 등
- 자동화 라벨링 기술 활용 수준 및 적정성
5
사업 추진체계
및 추진역량
(16)
o 추진체계(수행기관) 구성의 적정성
- 주관기관/참여기관 간 역할 분담의 적정성
- 주관기관의 사업 총괄관리 역량의 충분성
- 인공지능 응용개발 기업・기관의 개발 역량
- 수요기관의 실질적 산출물 활용 계획 타당성
6
o 주관기관/참여기관의 업무 수행 역량 및 준비도
- 인공지능 데이터 관련 업무 수행 및 경험, 실적 등
- 데이터 구축 사전 준비 우수성
* 인공지능 기술 인력, 장비, 시설, 지적재산권 등의 확보 여부
8
o 비상상황, 재난 발생 시 비상대책 및 교육계획의 적절성
- 안전관리 및 비상상황 대응 준비 사항, 매뉴얼 개발 등
- 비상시 데이터 구축 관련 참여 인력 교육 방법
o 사업장 안전 및 근로자 보호조치 등에 대한 안전관리 매뉴얼, 교육계획 등 재난·안전관리의 적정성
2
성과, 홍보, 지원방안 적정성
(3)
o 인공지능 학습용 데이터 홍보 및 성과 창출, 유지관리 우수성
- 인공지능 데이터 홍보, 데이터 활용 및 사업화 방안 등
o 데이터 하자보수 방안, 중장기 성과 창출 방안의 적정성 등
3
참여인력 처우개선, 상생 협력 및 사회적 가치구현
(7)
o 청년, 사회적 약자 등의 일자리 창출 및 고용안정 제공 수준
- 미취업자 우선 신규채용방안 및 예상채용인력 규모 제시
4
o 참여인력(크라우드소싱 포함) 확보 및 운영 방안, 교육, 급여 수준, 처우, 성장지원방안 등의 계획의 구체성 및 적정성
- 건전한 근로 여건 조성(처우개선, 지속적 근로기회 제공 등) 및 개발 계획의 적정성
- 크라우드소싱을 활용할 경우, 작업자에 대한 계약방법(계약서 등), 비용 지급방식, 지급 시기, 지급기준, 작업량 증빙 등 운영 방안의 적정성
3
평가 점수(합계)
100
부정당업자 여부
(감점 –30)
o 국가계약법에 따른 부정당제재 조치에 해당하는 업체
-30
구분
평가항목 및 기준
배점
과제 목표의
타당성
(9)
o 과제추진계획과 사업목표(AI 산업육성 등)와의 일치성
5
o 사업추진을 위한 체계 및 절차, 일정 계획의 타당성
4
데이터 구축
내용의 적합성
(33)
o 초거대AI 지원을 위한 말뭉치 확보 이행방안의 구체성
- 말뭉치 목표 구축량 달성을 위한 추진방안의 구체성
※ 추후 데이터 개방 시 공개적 활용에 대한 권리확보 포함 필수
7
o 인공지능 학습용 데이터 확보 계획의 적정성
- 원천 데이터 확보 방안의 타당성
- 법적 현안에 대한 사전검토 및 대응방안 적정성
6
o 원천 데이터 등의 확보에 대한 사전준비 충분성
- 데이터의 권리확보를 위한 계약, 협약, MOU 등 관련 사전 준비의 적정성(계약서, 협약서, 심의결과 등 증빙 확인)
- 데이터 수집 등을 위한 장비 확보의 충분성
- 세부 데이터별 포트폴리오(샘플 데이터) 적정성
7
o 인공지능 학습용 데이터 구축 방안의 우수성
- 데이터 구축 성과 목표(수량 등)의 적정성
- 데이터의 구축 공정(획득/수집, 정제, 가공) 단계의 절차 및 방법 적정성
8
o 인공지능 학습용 데이터 개인정보 조치 방안 적정성
- 개인정보 동의 등 개인정보 이용 및 권리 확보의 적정성
- 개인정보 비식별화 기술 및 방법의 우수성
5
품질목표 및 품질관리방안의 적정성
(21)
o 인공지능 학습용 데이터 품질목표 설정 및 관리체계 구축 적절성
- 인공지능 학습용 데이터 품질지표 및 목표의 타당성
- 수행기관의 인공지능 학습용 데이터 품질관리 역량
- 수행기관의 품질관리체계(조직/인력/절차/품질기준/도구 등) 준비도 및 구체성
9
o 인공지능 학습용 데이터 품질관리 방안의 적정성
- 인공지능 학습용 데이터의 품질관리(품질검사 등) 및 확보 방안의 구체성
12
인공지능 기술역량
(11)
o 인공지능 학습용 데이터 응용서비스 개발 우수성
- 수행기관 등의 데이터 활용 AI기술구현 및 모델 개발역량, 실현 가능성, 성능목표의 적정성
6
o 인공지능 학습용 데이터 저작도구 활용 적정성
- 저작도구 확보방안/저작도구 활용 방법 적정성 등
- 자동화 라벨링 기술 활용 수준 및 적정성
5
사업 추진체계
및 추진역량
(16)
o 추진체계(수행기관) 구성의 적정성
- 주관기관/참여기관 간 역할 분담의 적정성
- 주관기관의 사업 총괄관리 역량의 충분성
- 인공지능 응용개발 기업・기관의 개발 역량
- 수요기관의 실질적 산출물 활용 계획 타당성
6
o 주관기관/참여기관의 업무 수행 역량 및 준비도
- 인공지능 데이터 관련 업무 수행 및 경험, 실적 등
- 데이터 구축 사전 준비 우수성
* 인공지능 기술 인력, 장비, 시설, 지적재산권 등의 확보 여부
8
o 비상상황, 재난 발생 시 비상대책 및 교육계획의 적절성
- 안전관리 및 비상상황 대응 준비 사항, 매뉴얼 개발 등
- 비상시 데이터 구축 관련 참여 인력 교육 방법
o 사업장 안전 및 근로자 보호조치 등에 대한 안전관리 매뉴얼, 교육계획 등 재난·안전관리의 적정성
2
성과, 홍보, 지원방안 적정성
(3)
o 인공지능 학습용 데이터 홍보 및 성과 창출, 유지관리 우수성
- 인공지능 데이터 홍보, 데이터 활용 및 사업화 방안 등
o 데이터 하자보수 방안, 중장기 성과 창출 방안의 적정성 등
3
참여인력 처우개선, 상생 협력 및 사회적 가치구현
(7)
o 청년, 사회적 약자 등의 일자리 창출 및 고용안정 제공 수준
- 미취업자 우선 신규채용방안 및 예상채용인력 규모 제시
4
o 참여인력(크라우드소싱 포함) 확보 및 운영 방안, 교육, 급여 수준, 처우, 성장지원방안 등의 계획의 구체성 및 적정성
- 건전한 근로 여건 조성(처우개선, 지속적 근로기회 제공 등) 및 개발 계획의 적정성
- 크라우드소싱을 활용할 경우, 작업자에 대한 계약방법(계약서 등), 비용 지급방식, 지급 시기, 지급기준, 작업량 증빙 등 운영 방안의 적정성
3
평가 점수(합계)
100
부정당업자 여부
(감점 –30)
o 국가계약법에 따른 부정당제재 조치에 해당하는 업체
-30

 

□ 과제조정위원회 심의‧조정 및 수행계획서 확정

 

ㅇ 우선 지원 대상 수행기관은 지능정보원 관리지침에 따라 과제조정위원회에서 수행내용, 예산의 적정성 등을 종합적으로 검토하고 사업계획에 대해 조정 가능

 

- 우선 지원 대상 수행기관은 과제조정위원회에서 검토한 사항을 수행계획서에 반영하고, 지능정보원은 과제조정위원회에서 검토ㆍ조정한 사항의 반영 여부를 확인하고 협약 체결

 

ㅇ 우선 지원 대상 수행기관은 심의․조정결과를 합리적인 이유 없이 거부하는 경우 협약을 포기하는 것으로 간주하고 후보 과제 중 평가점수의 차순위 수행기관에 지원 가능

 

- 우선 지원 대상 수행기관은 통보받은 과제조정위원회의 조정결과에 대해 이의신청을 할 수 있으며 지능정보원은 관리지침에 따라 처리

 

ㅇ ‘19~’22년 인공지능 학습용 데이터 구축사업에서 수행한 사업수행계획서의 표절이 의심되는 경우(표절 검증 도구 등 활용) 과제조정위원회의 심의 결과에 따라 협약 체결이 거부될 수 있음

- 다만, 과제조정위원회에서 표절의 정도가 경미 하다고 판단하는 경우 사업수행계획서의 조정을 요청할 수 있음

 

ㅇ 과제조정위원회에서 표절로 판단하였거나, 과제조정을 하였음에도 합리적인 이유 없이 이를 거부하는 경우 후보 과제 중 평가점수의 차순위 수행기관에 지원할 수 있음

4

사업 요구 사항

 

□ 데이터 구축에 관한 사항

 

ㅇ 인공지능 학습용 데이터 구축 공정(방법, 절차 등)이 포함된 인공지능 학습용 데이터 구축 계획서(이하 구축 계획서)를 세부 데이터별로 작성하여 제안서 신청 시 제출(신청 서식 붙임 1)

 

- 구축 계획서는 ‘AI허브(www.aihub.or.kr)’에 공개한 ‘인공지능 학습용 데이터 구축 안내서 v3.0’를 참조하여 작성

 

※ ‘AI허브/정보공유/허브뉴스/품질가이드’ 공지사항의 '인공지능 학습용 데이터 품질관리 가이드라인 및 구축 안내서 v3.0' 발간 참조

 

- 수행기관의 구축 역량 확인을 위해 세부 데이터별 샘플 데이터(포트폴리오)를 데이터 구축 계획서에 포함시켜 제출 필수

 

* 샘플데이터는 실제 구축할 원본 데이터(예: 사진)와 라벨링 데이터로 구성·제출

 

- 최종 선정 시, 기 제출한 구축 계획서는 과제조정위원회와 지능정보원이 검토한 추가사항 등을 반영하여 최종적으로 확정한 후 사업 수행의 기준 문서로 활용

 

ㅇ 수행기관은 인공지능(AI) 학습(Training)에 적합한 형태와 내용의 원천 데이터 및 라벨링 데이터를 수집・제작 구축하여 누구나 사용할 수 있도록 AI허브를 통해 공개

 

* 세부적인 데이터 요구사항은 과제별 제안요구내용 ‘붙임’을 참조

 

ㅇ 종별 데이터 구축에 필요한 요구사항에 대한 부합성과 초기 품질을 확인하기 위한 사전 검증용 데이터 10% 이상을 중간 점검 실시 이전 제출해야 함

 

- 지능정보원 및 품질검증 전문기관인 한국정보통신기술협회(TTA) 등에서 실시한 사전 품질검증을 통해 도출된 조치 결과는 데이터 구축과정에 반드시 반영하여야 함

- 구축한 학습용 데이터를 활용한 1-Cycle 자가점검* 계획 및 결과 추가 제출

 

* 1-Cycle 자가점검 : 데이터 구축 비율에 따라 전 공정(획득/수집→정제→가공→학습)을 반복적으로 점검하여 데이터 품질 확보 및 보완을 시행하는 애자일 방식의 자가 점검 프로세스

 

※ 초기데이터 1-Cycle(10%) 및 중간데이터 자가점검(50%)은 필수 시행

 

ㅇ 데이터 최종 품질검증을 통해 도출된 결과와 내역에 따라 최종 품질 개선 또는 보완 조치를 하여야 하며, 이 모든 결과는 최종결과평가에 반영 예정

 

- 최종 품질검증 미달성 시, 별도 예산으로 제3자 품질검사업체를 통한 재검사를 필수 시행하며 검사 결과를 제출하여야 함

 

※ 최종 품질검증용 제반문서 및 데이터(100%)는 제출(~ `23.11)하여야 하며, 최종 제출 시기는 사업관리 상 필요에 따라 조정될 수 있음

 

ㅇ 구축한 데이터의 품질 및 유효성 검증을 위한 인공지능 모델 및 알고리즘 개발 필수

 

- 인공지능 응용 서비스 개발 역량을 보유한 수행기관이 구축 데이터를 활용한 인공지능 모델 및 알고리즘 개발

 

* 단, 인공지능 모델의 개발방법, 검증지표, 성능 목표는 계획서에 구체적으로 명시

 

ㅇ 인공지능 학습용 데이터는 객체기반 검색이 가능하도록 개념적 객체맵을 구성하고, 디렉토리 형식으로 구조화하여 제출

 

□ 데이터 품질에 관한 사항

 

ㅇ 인공지능 학습용 데이터 구축사업 품질관리 계획서(이하 품질관리 계획서)를 세부 데이터별로 작성하여 신청 시 제출(신청 서식 붙임 2)

 

- 품질관리 계획서는 ‘AI허브(www.aihub.or.kr)’에 공개한 ‘인공지능 학습용 데이터 품질관리 가이드라인 v3.0’을 참조하여 작성

 

※ ‘AI허브/정보공유/허브뉴스/품질가이드’ 공지사항의 '인공지능 학습용 데이터 품질관리 가이드라인 및 구축 안내서 v3.0' 발간 참조

- 선정 평가시 제출한 품질관리 계획서는 과제조정위원회와 지능정보원의 검토 사항을 반영하여 수정 확정한 후, 사업 수행을 위한 품질관리 및 검증의 기준 문서로 활용

 

- 인공지능 학습용 데이터의 최종 산출물(데이터, AI 모델 등)의 객관적 품질지표와 정량목표를 정의하고 품질관리 계획서에 명시하여 제출

 

* 품질지표 및 목표값은 과제조정위원회 검토를 통해 조정될 수 있음

 

- 품질관리 총괄 책임자를 지정하고 자체 품질검사를 위한 품질관리 조직* 구성·운영 필수

 

* 품질관리 총괄 책임자, 실무 책임자, 품질자문위원회, 데이터 획득/수집, 정제ㆍ가공, 검증 등 구축 단계별 품질 관리 조직, 구축 데이터의 품질 검증 조직 등을 포함

 

- 데이터 품질 검사를 위한 기준과 검사 절차를 마련하고 자체 품질검증 실시 후 오류 데이터에 대해서는 보완하여 제출

 

- 데이터 구축에 참여하는 모든 작업자를 대상으로 데이터 품질 확보를 위한 사전 품질관리 교육을 반드시 실시하여야 함

 

* 품질관리 교육은 참여인원 전체를 대상으로 하는 기본교육과 품질검사 실무자를 대상으로 하는 실무교육 등을 포함하여 교육계획 마련 및 추진

 

ㅇ 지능정보원 및 한국정보통신기술협회(TTA)의 중간점검 및 최종 산출물의 사전/최종 품질검증 활동에 적극적으로 협조

 

* 품질검증지표는 과제조정위원회 및 TTA 검토를 통해 완료

 

- 수행기관은 한국정보통신기술협회(TTA)의 데이터 품질검증 수행 및 품질검증에 필요한 환경 및 도구 등을 제공하고 구축된 데이터의 상시 모니터링(온라인 서버 접속 등)이 가능한 방법을 제공

 

- 점검 단계에서 품질에 대한 조정과 중요한 문제점에 대한 의견이 있을 경우 수행기관은 외부 전문기관의 컨설팅 등을 통해 검토․조치

 

 

□ 일자리 창출 및 참여인력에 관한 사항

 

ㅇ 총 인건비 중 크라우드소싱 인건비를 제외한 1억원 당 2.4명 이상의 인력을 신규 채용하고 3개월 이상에 참여자에 대해 사업실적으로 인정하며 최종결과평가에 반영

 

* 신규 인력은 ’23.1.1 이후 입사자부터 인정하고 정규직ㆍ계약직 무관

 

* 직접 고용 인력(정규직, 계약직)은 4대 사회보험 가입 필수

 

- 크라우드소싱 인건비 1억원 당 10명 이상의 작업자가 참여하고 월 60시간 이상 참여자에 대해 실적으로 인정하며 최종결과평가에 반영

 

* 상근형태로 참여하는 단기 인력은 크라우드소싱 인건비가 아닌 일용직 비목에 계상

 

ㅇ 크라우드소싱 도입 시 작업자의 권익 보호 방안, 적정 임금 제공 방안 등을 사업 수행계획서에 제시

 

- 크라우드소싱의 작업자에 대해 최저임금 이상을 보장

 

※ 크라우드소싱 작업자와 근로계약 체결방법, 임금 지급기준 및 방법 등에 대해 과제 조정 시 검토ㆍ확정 및 적용하며 NIA의 크라우드워커 표준 업무위탁계약서 사용

 

ㅇ 크라우드소싱 작업자의 안정적 고용 유도를 위해 역량 강화 교육 및 경력개발 지원에 관한 사항을 제시

 

※ 수행기관에서 실시하는 크라우드소싱 작업자 역량 강화 교육에 수당 및 여비 지급 가능

 

ㅇ 일부 크라우드소싱 작업자에 업무가 집중되거나, 적정 수준 이상의 고액 인건비가 지급되지 않도록 주의

 

※ 사업별로 크라우드소싱 작업자 인건비 상정을 위한 자체 기준 및 단가 범위를 사업계획서에 포함하여 제출

 

- 크라우드소싱 작업자의 업무 실적을 객관적으로 확인가능한 증빙자료(시스템 로그 등) 필수 확보 및 제출(증빙하지 못하는 경우 불인정)

 

 

□ 공개 및 성과 확산에 관한 사항

 

ㅇ 본 사업의 결과물인 인공지능 학습용 데이터, 모델 및 알고리즘 소스, 활용 가이드라인 및 매뉴얼 등은 지능정보원이 요구하는 방법에 따라 AI 허브에 개방(필수)

 

※ 헬스케어 데이터는 ‘안심존’에서 개방

 

※ 헬스케어 데이터 등 민감한 데이터(과제조정위원회에서 조정)를 제외하고는 AI허브에 공개된 인공지능 학습용 데이터에 대한 자유로운 이용권리*를 허용

 

* 공공누리 제2유형 : 저작물의 출처를 표시하고 저작물의 변경(재가공) 및 배포가 가능하나 상업적 이용은 금지

 

- 인공지능 학습용 데이터(원천데이터, 라벨링데이터 등), 저작도구, 알고리즘 및 모델 등 산출물 일체는 개방

 

- 학습용 데이터 구축을 위해 수집한 원시데이터는 수행기관에서 5년간 보관하고 지능정보원에서 요청시 제출

 

- 최종 데이터는 학습(Training), 검증(Validation), 시험(Test) 데이터로 구분하여 제출하고 기본 비율은 8 : 1 : 1로 제출

 

※ 과제의 특성에 따라 비율은 변경할 수 있음(과제조정위원회에서 검토・확정)

 

- 모든 사업 결과물은 사업 종료 1개월 전까지 지능정보원에 제출하고 검토 의견에 대해 보완 후 사업 종료 시까지 최종 제출

 

- 데이터별 설명서(양식 별도 제공), 데이터별 활용 교육 영상(데이터 1종당 1개) 개별 제작 후, AI 허브에 개방 필수

 

ㅇ 필요시 수행기관은 인공지능 학습용 데이터를 활용한 경진대회를 과제조정위원회의 검토 및 확정을 거쳐 개최 가능

 

ㅇ 홍보 활동(보도자료 및 인터뷰, 광고 활동) 시 지원사업의 사업명, 과제명, 기관 명칭 사용 필수

 

* 한국지능정보사회진흥원이 지원하는 인공지능 학습용 데이터 구축 사업임을 필히 명기

 

- 모든 홍보 자료(카드뉴스, 동영상, 포스터 등)에 한국지능정보사회진흥원 로고를 삽입

 

□ 법적권리에 관한 사항

 

ㅇ 지식재산권, 초상권, 개인정보보호 등에 적법하고, AI허브에서 공개, 배포, 활용에 문제가 없는 원천 데이터를 확보하여 데이터 구축

 

* 원시데이터 등의 확보를 위해 활용할 개인정보수집・활용 동의서, 초상권 이용 동의서, 저작권 계약서는 지능정보원에서 제공하는 양식 및 가이드라인을 활용(신청 서식 9, 10, 11)

 

- 데이터의 개인정보(얼굴, 번호판 등), 국가보안사항(공간정보, 위치정보 등) 등이 포함된 경우 개인정보‧민감정보 비식별화 조치

 

- 협약 이전에 데이터 수집, 가공, 공개와 관련한 법적사항에 대한 법률 검토 결과 등의 제출 및 과제조정위원회의 사전 검토 필수

 

- 구매 및 협약 등을 통해 원시 데이터 등을 확보하는 경우 제안서 접수 시 증빙자료(계약서, 협약서, MOU 등) 제출

 

* 헬스케어 영역 데이터의 경우, 협약 전에 IRB 또는 DRB 결과서를 제출 필수

* “원시데이터”란, 기계학습을 목적으로 최초 단계에서 수집 또는 생성한 음성, 이미지, 영상, 텍스트 등의 데이터로 전처리를 거치지 않은 데이터를 말함

 

- 데이터 구축 및 인공지능 개발에 활용되는 모든 콘텐츠(이미지, 영상, 음성 등)와 데이터는 법률에 의거한 적법한 방법으로 수집ㆍ확보되어야 하며, 관련된 법률상 분쟁에 대해서는 수행기관에서 일체의 책임을 부담

 

- 수행기관이 계약을 수행함에 있어 제3자의 특허권 또는 저작권, 지재권, 초상권, 개인정보 등을 침해하여 손해배상 청구소송 등이 제기되면 수행기관에서 피해자 측에 소송 결과에 따라 합의 배상

 

ㅇ 수행기관은 사업 추진과정에서 취득한 기술 등 성과의 확산, 활용성 제고, 지식재산권 확보 및 관리 등에 필요한 조치를 강구

 

- 본 과제 수행 산출물(원시 데이터 포함) 및 실적 자료는 과제 종료 후 5년간 보존해야 하며 지능정보원에서 요청 시 제출

 

ㅇ 학습용 데이터 중 수행기관이 이번 사업 참여 이전에 직접 구축하여 보유하고 있거나, 데이터에 대한 소유권을 기 확보하고 있는 원천 데이터(영상, 이미지, 음성 등)를 동 사업에서 활용가능하나 해당 데이터의 수집 및 사용 비용을 동 사업비에 책정할 수 없음

 

※ 기존에 구축한 데이터 구축 비용을 동 사업에 포함하여 정산 등을 하는 경우, 거짓이나 그 밖의 부정한 방법으로 공공재정에 손해를 입히는 부정 청구로 해석

 

 

□ 개인정보보호 및 관리에 관한 사항

 

ㅇ 데이터 구축에 개인정보가 포함 되는지 여부와 이를 포함하는 경우 반드시 개인정보의 구체적인 사항을 사업수행계획서에 포함

 

ㅇ 개인정보를 활용하는 경우, 개인정보보호법 상의 의무․권고사항에 대해 사전점검 및 법률 자문을 실시하고 그 결과를 사업수행계획서에 포함

 

* 인공지능 개인정보보호 자율점검표(개인정보위, ‘21.5)에 따른 자가 점검을 실시하고 그 결과를 제출 및 과제조정위원회에서 검토

 

ㅇ 개인정보보호 및 관리를 위한 이행․점검‧조치 방안을 사업수행계획서에 구체적으로 제시

 

* 개인정보 비식별화를 시행하는 경우 ’가명정보 처리 가이드라인(개보위)‘을 준수

 

ㅇ 수행기관(주관기관, 참여기관) 담당자는 사업착수단계에서 지능정보원에서 시행하는 개인정보보호 교육 필수 이수

 

ㅇ 개인정보보호법의 심각한 위반사항 발생시 관련 법령 및 규정에 따라 협약 해지, 사업참여제한 등의 불이익을 받을 수 있음

 

 

□ 보완조치 요구사항

 

ㅇ 외부 품질검증 지적사항, 사후 발견된 데이터 누락 및 오류사항 등에 대한 조치 계획을 마련하여 제출하고 그에 따른 보완 조치 결과 또한 제출하여야 하며 최소 3년 보완 의무 수행 필수

 

- 외부 품질검증 지적, 오류사항에 대해 보완된 데이터는 필요에 따라 전담기관과 협의 후 별도 예산으로 제3자 품질검사업체를 통한 품질검사를 시행하고 검사 결과 또한 제출하여야 함

 

* 협약체결 시 별도의 보완조치기간 및 방법에 대한 조항을 협약서에 포함

 

ㅇ 본 사업에 참여한 수행기관이 각종 정부지원사업(AI 데이터 가공바우처, AI 바우처, AI+X 등)을 통해 타 기관이나 기업 등에 기구축하여 제공한 데이터를 재활용한 것이 확인될 경우 재활용 데이터는 불인정, 협약 취소, 향후 과제참여 불가 등 제재를 받을 수 있음

 

※ 거짓이나 그 밖의 부정한 방법으로 공공재정에 손해를 입히는 경우, 부정 청구로 해석

 

□ 사업관리 요구사항

 

ㅇ 일반적 사업관리 추진현황은 주간(격주)/월간 보고와 필요에 따라 수시보고로 진행하고 착수보고회, 중간점검, 최종결과평가를 실시

 

- 사업 수행 중 중간 결과물(중간보고서), 최종 결과물(최종결과 보고서)을 확인하기 위해 현장실사 등을 통해 진행상황 점검

 

- 최종 결과보고서, 정산보고서 및 증빙자료는 사업종료 후 30일 이내 제출

 

* 각종 보고서의 제출 시기는 사업관리 상 필요에 따라 조정될 수 있음

 

ㅇ 데이터 수집, 정제ㆍ가공, 검증 등 인공지능 학습용 데이터 구축은 수행기관(주관기관, 참여기관)에서 직접 수행하는 것이 원칙

 

- 다만, 수행기관이 아닌 외부 기관의 용역을 통해 데이터 구축 등을 할 경우에는 제안 단계에서부터 사업수행계획서에 용역 계획을 사전에 수립하여 제출하고 과제조정위원회에서 조정한 범위 내에서 가능

- 위탁용역비는 정부지원금에서 위탁용역비를 뺀 사업비의 40% 이내로 산정

 

* 위탁용역·장비 구매 등 발주 시 ‘국가를 당사자로 하는 계약에 관한 법률‘을 준용하여 사업비 집행

< 위탁용역비 산정 기준 >
▸ 위탁용역비 = 정부지원금 X 약 28.57%(7분의2) 이내
- 정부지원금이 10억원일 경우 2.857억원 이내 편성

 

ㅇ 과제 추진기간 중 과제목표 등 추진 상의 중대한 계획 변경이 있을 경우 정해진 절차에 따라 지능정보원에 사전 신청 및 승인 후 시행 가능

 

ㅇ 참여인력 변경에 관한 사항은 지능정보원과 사전 협의 필수

 

□ 사업비 산정 및 정산에 관한 사항

 

ㅇ 사업비는 정보통신진흥기금운용관리 규정(과학기술정보통신부 고시)과 부속 지침 등에 따라 산정

 

* 동 사업은 비R&D 사업으로 간접비를 책정할 수 없음

 

- 사업비는 과제조정위원회에서 예산산출 적정성 검토 후 최종 확정

 

- 사업비(정부지원금 및 민간부담금 현금)는 다른 용도의 자금과 분리하여 전용 계좌 관리․운영하며 해당 계좌와 연결된 사업비 카드 또는 계좌이체 등을 통해 투명하게 집행

 

- 사업비 집행내역은 관련 증빙자료와 함께 관리하고 점검·정산 시 제출

 

* 집행 내역은 즉시 KCA 사업관리시스템(PMS)에 등록하여 상시 관리해야 하며 부실입력, 증빙자료 미흡시 정산 등에서 불이익을 받을 수 있음

 

* 사업비 사용 증빙은 5년간 보관하고 지능정보원이 요구 시 제출

 

ㅇ ’23.1.1. 기준 3년 이내 입사자는 정부지원금으로 인건비를 전액 반영할 수 있으며 초과자는 임금의 최대 50% 이내에서 책정 가능

 

* 신규 인력의 인건비는 경력 등을 고려하여 수행기관 급여기준에 준하여 산정하되 통계청 기준 임금근로자 월평균 소득의 3배를 넘지 않아야 함. 단, 초과자는 이에 대한 사유 및 증빙 제출 필수

ㅇ 크라우드소싱 작업자 인건비는 반드시 예산항목 중 ‘일용임금’에 산정

 

- 크라우드소싱 작업자의 대가는 과제종료 전에 집행된 부분만 인정

 

ㅇ 참여인력(크라우드 소싱 포함)은 원칙상 국내거주 대한민국 국적자로 제한

 

- 단, 외국어를 모국어로 하는 해외 거주 외국인이 언어(음성, 자연어 등)와 관련된 데이터 구축 등을 위해 참여가 불가피한 경우, 과제조정위원회가 조정한 범위 내에서 사전 승인을 받아 참여 가능

 

* 해당 참여 외국인의 신원, 계좌, 입금현황 등 예산집행의 투명한 증빙이 가능한 외국인에 한함

 

- 국내 거주 외국인(유학생 연구원 등)의 참여가 불가피한 경우 과제조정위원회에서 조정한 범위 내에서 참여 가능

 

ㅇ 인공지능 모델 개발을 위한 GPU 서버 등 고가의 장비 지양 및 자산취득을 최소화하고 임대를 권고

 

ㅇ 자사 개발 솔루션의 현물 출자, 다수 과제 참여시 자산의 중복 현물 출자는 불인정

 

ㅇ 정보통신기금 등 정부지원사업을 통해 획득한 자산은 현물 불인정

 

ㅇ 지능정보원의 승인이 필요한 사업비 변경 또는 사용에 대해 사전 승인 절차를 거치지 않고 집행한 경우 사업비 불인정

 

ㅇ 사업비의 집행내역 검토 및 정산은 정보통신진흥기금 운용·관리규정(과학기술정보통신부고시) 및 부속지침, 2023년 예산안 편성 및 기금운용계획안 작성 및 세부지침을 준용

 

※ 상기 규정 등은 과학기술정보통신부 정보통신신흥기금 운용‧관리 규정 및 부속 지침의 제개정시 해당 지침으로 대체하여 적용

 

ㅇ 수행기관은 사업비 사용실적을 사업종료일로부터 30일 이내에 별도로 정하는 서식에 따라 지능정보원에 제출

 

- 사업비 정산결과 사용잔액이 있거나 사업비를 부당하게 집행한 경우 해당 금액 중 출연금 지분에 해당하는 금액은 환수(사업비 사용 증빙은 5년간 보관)

 

- 사업비 정산은 지능정보원이 지정한 전문회계법인을 통하여 위탁 진행하며 사업비 정산 비용은 주관기관 및 참여기관에서 각각 부담(사업비에 산정 필수)

 

* ‘기금 사업비 산정 및 정산 등에 관한 지침’ 참조하여 수행기관별로 각각 산정

 

ㅇ 사업비의 부정청구 또는 편취한 경우 차년도 사업의 선정 평가대상에서 배제할 수 있음

 

□ 기타

 

ㅇ 「기금사업 결과 평가 등에 관한 지침」에 의한 최종결과평가의 결과가 ‘매우 미흡’인 경우 차년도 사업의 선정 평가대상에서 배제할 수 있음

 

ㅇ 과제 참여 인원은 과제 수행 중 취득한 모든 결과물을 지능정보원의 승인 없이는 외부에 제공 또는 다른 용도로 활용 금지

 

- 수행과정에서 발생할 수 있는 개인정보 노출, 자료요출 등 보안사고를 방지를 위한 보안정책을 수립

 

ㅇ 수행과정에서 천재지변, 전염병(코로나19 등) 등 불가항력적인 상황에 따라 과업 범위를 전부 또는 일부를 변경하거나 협약 해약 가능

 

o 안전조치 및 보건 조치

 

- 분임 안전보건 책임자는 사업장의 환경을 고려하여 소속 근로자와 관계 수급인 근로자의 산업재해를 예방하는 데 필요한 안전조치 및 보건 조치에 대한 사업주의 이행을 확인하여야 함

 

- 협약체결 시 지능정보원 사업장 안전보건관리가이드 양식을 사업담당자에게 제출

반응형

댓글