kocca_rnd2023년 한국콘텐츠진흥원 연구개발사업딥러닝을 적용한 음악사용내역 매칭 솔루션 개발 결과
2023년 한국콘텐츠진흥원 연구개발사업 딥러닝을 적용한 음악사용내역 매칭 솔루션 개발 결과

미분배사용내역 분석

편집앨범에 대한 분석 (F2)

음악시장은 신곡 시장과 구 음원(Back Catalogue) 시장으로 구분 할 수 있다.
대형 음반사를 비롯한 음반사들은 구 음원의 재사용을 위하여 편집앨범(Compilation)을 쏟아내고 있는 실정이다.
이 과정에서 불법적인 라이센싱을 통하여 편집앨범이 발매되기도 한다.
때문에 편집앨범은 권리앨범으로 등록하는 것을 신중히 처리하여야 하지만, (기본적으로 권리앨범으로 등록 불가)

‘연제협’의 권리음악정보 역시 편집앨범을 권리앨범으로 등록하고 있어 원 제작자의 앨범에 수록된 곡과 중복이 상당수가 존재한다.
나아가 편집앨범을 악의적인 목적으로 불법 라이센싱하여 발매하는 사례들도 많아 권리중복을 더욱 심화 시키고 있는 실정이다.
편집앨범에 수록된 곡들은 원곡자(원 제작자)에게 분배되어야 하지만 권리 중복이 발생 할 경우 권리매칭의 기준을 특정 할 수 없기 때문에 분배가 보류되어 미 분배로 처리된다.

이러한 문제를 해결하기 위하여 우선적으로 사용내역(Usage Log)과 권리정보의 매칭된 정보를 판단하는 절차가 필요하고 편집앨범을 구분 할 수 있는 알고리즘이 적용되어야 한다.

이미 개발사는 편집앨범을 구분하는 Classify Algorithm을 구현하여 편집앨범을 분류 할 수 있도록 하였고 이를 자동화 하였다.

자동화 이후 이를 검증하는 딥러닝 프로세스를 구현하여 정확도를 학습시킬 계획이다.

편집앨범을 분배 확정하는 정책과 알고리즘도 적용하여 분배의 근거를 마련하였으며 아래와 같이 처리 규정을 마련하였다.

  • 가. 곡명과 가수명이 매칭되었지만 앨범명이 매칭되지 않는 정보를 편집앨범이라 한다.
  • 나. 편집앨범으로 구분된 매칭정보는 원제작자, 메이저 음반사, 중견 음반사, 독립 음반사의 우선순위를 적용한다.
  • 다. 우선 순위에 따라 매칭된 정보는 ‘연제협’의 확인절차를 거쳐 최종 분배 처리한다.
  • 라. 확인이 불가한 매칭 정보는 추후 개선된 알고리즘 또는 AI Classification*을 적용하여 처리한다.
  • 마. 전항에 해당하는 정보는 별도로 관리한다.
  • 최근에는 서비스 사업자의 Play List가 디지털 편집앨범으로 자체 발매되어 더욱 혼란스러운 상황이지만 본 알고리즘과 처리 규정으로 해결이 가능하다.
  • AI Classification*: 학습데이터를 기반으로 인공지능 학습모델을 설정하여 데이터를 분류 처리하는 솔루션.
  • AI 앨범명 검증*: 학습데이터를 기반으로 앨범명의 True와 False 값을 인공지능 학습모델이 판단하는 프로세스이며 True와 False 값 이외의 값은 별도로 판단한다.

앨범명 판단 기준 특징 처리방안
매칭 레이트 앨범명의 문자열을 매칭하여 매칭율을 구한고 특정 매칭율을 True와 False 값의 기준 값으로 정하고 Weight값을 설정한다. AI 검증 처리
Weight 값 업데이트
엔트로피 값 엔트로피 값을 추가로 대입하여 True와 False 값의기준 값을 보완한다. 엔트로피 값이 0에 가까울수록 불확실성이 낮다.
별도 사례 사용내역의 오타가 발생한 경우
서비스업자가 앨범명을 임의로 수정한 경우
앨범명에 특수문자가 삽입된 경우
앨범명에 Remix, Live, Cover 등의 문자열이 포함된 경우
각 Context에 맞는 알로리즘을 적용하여 처리

커버앨범에 대한 분석 (P1, P2)

커버앨범 즉, 리메이크(Remake)앨범은 과거의 곡을 현대적 또는 또 다른 해석으로 재 레코딩하여 발매하는 형태를 말한다.
이 것은 곡명은 같지만 가수명, 앨범명이 다를 수 있다는 것을 전제로 한다.
커버앨범은 아래와 같은 패턴으로 사용내역에 수집된다

앨범 TYPE 특징 처리방안
합법 라이센싱 리메이크(P1) 가수명이 다르거나 같음
정상적인 음반사에서 발매
BEST / LIVE / 테마별 앨범 형태로 발매 되는 경우가 많음
앨범명과 곡명에 Remix, Live, Cover 등의 문자열이 포함된 경우
권리음악정보 중 권리자 레벨이 ML, LL, IL과 매칭되면 분배 처리
불법 라이센싱 리메이크(P2) 가수명이 다름
독립 음반사나 영세 음반사에서 발매
시대별, 테마별로 발매하는 경우가 많음
앨범명과 곡명에 Remix, Live, Cover 등의 문자열이 포함된 경우
미분배 처리 후 별도 관리
추후 원제작자에게 매칭하는 프로세스 적용
불법 라이브 커버 앨범(P2) YouTube용으로 발매하는 경우가 많음.
리믹스 또는 라이브 형태로 발매하는 경우가 많음.
미분배 처리 후 별도 관리
추후 원제작자에게 매칭하는 프로세스 적용

커버앨범에 대한 분석 및 처리 알고리즘은 ‘연제협’과의 정책 수립 후 구현하여 적용하여야 한다.
또한 최초 권리음악 등록 단계부터 커버 앨범이 필터링 되어 등록이 되지 않도록 하는 프로세스도 필요하다.

  • 개발사는 권리음악정보가 모두 정제되었다는 전제로 원제작자에게 또는 대형 메이저 음반사의 원곡으로 분배하는 프로세스(P Process; 원곡 우선 매칭)를 구현하였고 이를 적용하여 원곡 권리자에게 분배되도록 하였다.
  • 이 프로세스는 곡명과 권리자 레벨이 True와 False 값을 판단하는 기준 값으로 가수명과 앨범명이 매칭 되지 않는 정보만을 분류하여 적용하였다.
  • 프로세스 적용 이전에 UCI 표준 음악정보와 매칭된 임시 권리음악정보와 비교하여 임시권리음악정보와 중복되는 정보는 제외한다. (연제협과 협의 후 분배 결정을 진행한다.)

클래식, 재즈, 국악 앨범에 대한 분석 (P1, P2)

클래식, 재즈 장르의 사용내역은 일반 상업용 음악과 다른 속성을 가지고 있다.

항목 특징 처리방안
곡명 주로 작곡가와 곡의 테마를 주제로 한 곡명을 사용한다. 곡명이 일치하면 매칭
가수명 주로 오케스트라, 연주자, 실연자를 모두 입력한다. Text의 길이가 길고 매칭율이 현저히 낮다. 클래식에 사용되는 전문용어를 삭제한 후 매칭
앨범명 대표 작곡가, 대표 오케스트라, 대표 연주자, 테마를 앨범 제목으로 사용
주로 편집앨범, 커버앨범 형태
앨범명이 일치하면 매칭
권리자 레벨을 참조

  • 국악 앨범의 경우 실연자 및 가창자 중심이므로 매칭율 조정계수를 변경 할 필요가 있다.
  • 클래식, 재즈 음악의 경우 저작권 및 인접권 만료시기를 확인하여 분배 보류 및 Public Domain 영역으로 구분하는 작업도 필요하다.
  • 가. 클래식 곡명의 예
    Rachmaninov: Piano Concertos 2 & 3 - Rhapsody on a Theme of Paganini
    Rachmaninoff:Suites Nos. 1 & 2; Symphonic Dances for 2 Pianos
    Haydn: String Quartets Op. 76 Nos. 1-3
    Beethoven: Symphony No. 5 in C Minor, Op. 67: I. Allegro con brio
    Beethoven: Violin Sonata No.1 & Piano Trio No.7 `archduke` (베토벤: 바이올린 소나타 1번 & 피아노 3중주 7번 `대공`)
    나. 클래식, 재즈 앨범명의 예
    내 영혼이 숨쉬는 음악, 바흐를 만나다 (영화, 방송 시그널, CF광고 테마, 클래식 - 휴식, 명상, 태교, OST 명 연주)
    아이들을 위한 편안한 클래식
    책과 함께하는 클래식
    가든 파티를 위한 클래식
    네티즌 추천! 가장 쉬운 클래식 100곡
    JAZZ INSTRUMENTAL (재즈 연주곡 베스트 모음집)
    재즈, 가을을 부탁해
    불멸의 재즈 Top 100 (재즈 명곡 마스터즈)
    Jazz With Wine (와인과 함께 즐기는 재즈)
    시간 훅가는 최애 명곡 쿨 재즈 (All Time Favorite Coolest Jazz)
    다. 클래식, 재즈 가수명의 예 볼드로 표시한 용어는 매칭율에 도움이 되지 않기 때문에 매칭율 계상 시 치환하여 매칭율을 구해야 한다
    클래식 (가수) 재즈 (가수)
    Smetana Quartet Charlie Christian, Benny Goodman Sextet
    Stuttgart Radio Symphony Orchestra, Garcia Navarro The Pasadena Roof Orchestra
    Philadelphia Orchestra conducted by Eugene Ormandy Benny Goodman & His Orchestra
    THE GLENN MILLER ORCHESTRA Beegie Adair Trio
    101 Strings Orchestra King Oliver`s Creole Jazz Band

종교음악, 동요 앨범에 대한 분석 (F4)

종교음악 및 동요의 사용내역은 다음과 같은 속성을 가지고 있는 것으로 분석된다.
이 영역은 매칭율이 현저히 떨어지므로 미 분배 정보를 해당 권리사에게 공개하여 각 권리사들이 자신의 권리음악을 확정하여 검증받는 프로세스를 제공하거나,
분배 대상 기준연도를 정해 비율분배에 대한 해당 권리자의 비율을 정하여 비율분배 프로세스를 적용하여야 한다.

항목 특징 처리방안
곡명 종교음악의 경우 성경, 불경을 인용한 곡명을 주로 사용한다. 곡명이 일치하면 매칭
가수명 주로 합창단, 가창자를 입력한다.
실질적 합창단과 가창자의 확인에 어려움이 있다.
사용내역의 가수명 오타 입력이 많다.
가수명이 일치하면 매칭
예외 사항은 별도 처리 방안 필요
앨범명 종교음악의 경우 성경, 불경을 인용하여 앨범 제목으로 사용
주로 편집앨범, 커버앨범 형태
앨범명이 일치하면 매칭
권리자 레벨을 참조

  • 종교음악, 동요를 제작하는 음반사는 대형 음반사, 독립 음반사로 구분되어 있고 독립 음반사의 경우 이 영역의 전문성을 보유한 경우가 대부분이다.
  • 비율분배 : 권리자를 일정 방법으로 찾지 못하여 미분배로 남아 있는 특정 데이터를 기존의 분배된 내역을 기준으로 비율로 산정하여 분배하는 방법이다.
    이 방법은 미국의 PRO에서도 사용내역을 모니터링 할 수 없거나 사용내역을 권리음악에 특정 기간 동안 도저히 매칭 할 수 없는 분배 프로세스에서 사용하는 방법이다.
  • 프로세스 적용 이전에 UCI 표준 음악정보와 매칭된 임시 권리음악정보와 비교하여 임시권리음악정보와 중복되는 정보는 제외한다. (연제협과 협의 후 분배 결정을 진행한다.)
  • 비율분배 프로세스는 연제협과 비율분배에 대한 정책과 규정을 마련하여 프로세스를 적용하여 처리하는 것을 원칙으로 한다.
  • 개발사는 비율분배에 대하여 대상 정보를 분류하는 Classify Algorithm을 구현하였고 비율 분배를 적용하는 프로세스도 구현하였다.

리믹스 앨범에 대한 분석

리믹스 란 발매된 앨범을 재해석하여 트랙을 다시 Mix-Down 하거나 또 다른 음악적 요소를 가미하여 원곡에 대한 새로운 형태와 느낌을 주는 음악적 방법이다.
보통은 과거의 곡을 리믹스하나 원곡과 다른 버전으로 동시 발매하는 경우도 많다

리믹스를 하는 아티스트의 참여도에 따라 앨범, 곡 자체의 저작인접권 지분이 변화될 수 있으므로 원곡과는 다른 곡으로 구분하는 것이 원칙이다.
하지만 불법적으로 리믹스하여 발매하는 사례도 많아 반드시 제작사를 참고로 하여 매칭 처리하여야 한다.
또한 이러한 불법적 라이센싱을 통한 리믹스 앨범, 곡 들은 원천적으로 권리음악정보에 등록하지 않아야 한다.

사용내역 또는 권리음악정보의 리믹스 곡명 입력은 주로 아래와 같이 입력된다.
You & Me (Flume Remix)
Rebelution (Clean Version)
Ameno (Extended Mix)
Ameno (Acoustic Version)
Ameno (Stripped)
A Time For Love (Album Version)

Various Artist의 처리

가수명에 ‘Various Artist’가 입력된 사례는 사용내역 뿐만 아니라 권리음악정보에도 상당수가 존재한다.
특히 OST, 옴니버스 앨범, 클래식 앨범, 재즈 앨범, 편집 앨범, 종교음악, 동요 앨범에서 주로 사용된다.
이 밖에도 ‘Unknown’도 사용내역에서 많이 입력되기 때문에 같은 맥락으로 해석하여야 한다.

사용내역 권리음악정보 처리방안
(1) Various Artist
Unknown
Various Artist
Unknown
가수명이 일치하면 매칭
앨범명의 매칭율로 판단하여야 함.
(2) Various Artist
Unknown
가수명 앨범명의 매칭율로 판단하여야 함.
앨범명의 매칭율이 낮을 경우 매칭 정책이 필요
(3) 가수명 Various Artist
Unknown
앨범명의 매칭율로 판단하여야 함.
앨범명의 매칭율이 낮을 경우 매칭 정책이 필요
(4) 가수명 가수명 곡명과 앨범명의 매칭율이 90%이상일 경우
사용내역과 권리음악 정보 입력이 오타일 경우

  • (1), (2)의 경우에는 곡명, 앨범명이 매칭율에 따라 분배 처리한다.
  • (3)의 경우에는 곡명, 앨범명이 매칭율에 따라 분배 처리하지만 사용로그에 가수명이 있으므로 권리음악정보의 가수명을 검증하여야 하는 단계가 삽입되어야 한다.
  • 현재 UCI 정보와 권리음악정보를 매칭하였기 때문에 권리음악정보를 UCI 음악정보로 대체하여 참조할 수 있는 검증 로직을 구현할 수 있다. (AI 가수명 검증 프로세스)
  • (3)의 경우에는 연제협과 비율분배에 대한 정책과 규정을 마련하여 프로세스를 적용하여 처리하는 것을 원칙으로 한다.

곡명만 표기한 사용내역의 처리

공연 영역의 사용내역에서 곡명만 입력하여 사용내역을 제출하는 사례가 많이 발생한다.
공연 사업자의 인식 부족 및 홍보 부족으로 발생하는 경우가 많다. 이를 해결하려면 다음과 같은 해결책이 필요하다.
특히, ‘꿈’이라는 곡명은 조용필, 이현우의 동명 제목의 곡명으로 곡명만으로는 판잔 할 수 없기 때문에 이 사례는 매칭 보류한다.
이러한 동명곡 사례를 제외하고 다음과 같은 처리 프로세스를 적용한다.

  • 곡명을 매칭하여 원곡자에게 매칭해주는 매칭 및 분배 정책
  • 곡명을 매칭하여 연제협과 비율분배에 대한 정책과 규정을 마련하여 비율분배 프로세스를 적용하여 처리하는 것을 원칙으로 한다.

비정상적 사용횟수 사례

특히 디음송 사업자에게 사례가 발생한다. 디음송 사업자는 서비스 플랫폼을 가지고 있고 사용자가 선택하여 음악을 사용하는 것이 아니고 사업자가 일방적으로 서비스하기 때문에 이러한 사례가 발생한다.
다음은 비정상적 사용횟수의 사례들이며 이는 분배 측면에서 투명성과 공정성을 심각히 손상시킬 수 있다.
이에 대한 처리 방안과 대책도 필요한 실정이다.

판매수량 Level 로그앨범명 로그곡명 로그가수명
2,223,434 1 아무말 대잔치 Part. 11 현금은 필수야 속닥속닥
2,195,809 1 아무말 대잔치 Part. 9 음식물을 조심해요 속닥속닥
2,632,470 1 NOINPUT03 음식물을 조심해요 속닥속닥
1,094,368 1 아무말 대잔치 Part. 14 매대에서 조심해 속닥속닥

  • Sales Count 수가 같은 시기에 현저히 많이 발생한 사례
  • 개발사는 Anomaly Detection을 통하여 비정상적인 사용횟수의 사용내역 정보를 추출하여 비 정상 데이터의 시각화를 구현할 계획이다.

Loading...