티스토리 뷰
안녕하세요~ 공감능력자 입니다.
오늘은 인터넷상에서 인형 눈 붙이기 전문가라고도 말하는 데이터 라벨링, 데이터 레이블러에 대해 알아보려고 합니다.
모두들 한 번쯤은 들어봤을 데이터 라벨링, 최근 코로나19로 인하여 사람들이 집에 있는 시간이 많아 지면서 각광을 받고 있는 부업중에 하나이기도 합니다. 스마트 폰만 있으면 장소에 구애 받지 않고 할 수 있다는 큰 장점을 가진 만큼 사람들에게도 인기가 점점 올라가고 있습니다.
데이터 라벨링이 뭐죠?
데이터 라벨링은 쉽게 말하자면 인공지능(AI)을 학습시키는 것입니다. 인공지능 과외하기라고도 합니다. 사람이 인공지능(AI)이 배울 수 있도록 학습교재를 만들어 주는것과 같습니다. 인공지능(AI)은 학습을 하기위해 데이터를 모아야 하는데 이때 이 데이터가 어떤 데이터인지 우리가 라벨을 달아주는 것입니다.
예시1) 강아지가 나온 사진에 강아지만 표시한 뒤 이런게 강아지야 라는 이름을 붙이고 계속해서 인공지능에게 보여주면 인식하게 되는 것 입니다.
예시2) 의학의 경우 의사들이 여러가지 엑스레이 및 영상 촬영 사진을 보고 정상, 비정상 내지는 염증이 있는 지를 구별하여 엑스레이에 이름을 붙입니다. 인공지능(AI)에게 라벨링이 된 해당 데이터를 계속 보여주면서 학습하게 한다면 인공지능(AI)은 환자의 엑스레이만 보고 어떤 사진이 정상이고 비정상인지를 판별하게 됩니다.
데이터 라벨링 어떤 작업을 하나요?
데이터 라벨링은 크게 2가지 작업방식으로 나누어 집니다. 수집과 가공입니다. 수집은 기본 데이터를 확보하는 작업으로 한가지 대상의 사진, 영상, 목소리 녹음 등을 제공하는 것입니다.
수집작업으로 모아진 데이터를 다듬는 방법이 가공입니다. 가공은 다시 "이미지 바운딩", "스켈레톤 추출", "지문문장 요약", "텍스트 태깅" 4가지로 분류됩니다.
"이미지 바운딩"은 해당 이미지를 그림안에서 추출해 내 인공지능 학습자료 됩니다. "스켈레톤 추출"은 동영상에 나오는 사람의 모습에 뼈대를 그리는 작업입니다. 사람행동을 분석하는 인공지능의 학습자료로 쓰입니다. "지문문장 요약"은 음성데이터를 정확한 문장으로 다듬는 과정으로 꾸밈말을 빼내고 간단한 문장으로 간단하게 줄이는 것입니다. 이는 시리, 빅스비 같은 인공지능(AI)을 학습시키는 자료로 쓰입니다. 마지막으로 "텍스트 태깅"은 두 문장을 읽고 의미가 같은지 구분하는 작업입니다. 이 자료는 번역 엔진의 정확도를 높이는 자료로 쓰입니다.
'공감 정보' 카테고리의 다른 글
서울시 임산부 교통비 70만원 지원(7월 부터) (0) | 2022.05.02 |
---|---|
마스크 해제(5월 2일부터) 버스 지하철탈때, 사회적 거리두기 (0) | 2022.04.30 |
코로나 사회적 거리두기 개정(4월18일 부터) (0) | 2022.04.15 |
서울시 고령자 운전면허증 반납 신청방법 및 혜택 (0) | 2022.04.09 |
어린이집 아동학대 신고 CCTV 열람 방법 어린이집 불편신고 (0) | 2022.04.04 |