UPDATED. 2020-12-02 16:27 (수)
2020.12.02(수)
  • 서울
  • B
  • 보통
  • 경기
  • B
  • 보통
  • 인천
  • B
  • 보통
  • 광주
  • B
  • 좋음
  • 대전
  • B
  • 보통
  • 대구
  • B
  • 보통
  • 울산
  • B
  • 좋음
  • 부산
  • B
  • 좋음
  • 강원
  • B
  • 좋음
  • 충북
  • B
  • 보통
  • 충남
  • B
  • 보통
  • 전북
  • B
  • 보통
  • 전남
  • B
  • 좋음
  • 경북
  • B
  • 좋음
  • 경남
  • B
  • 좋음
  • 제주
  • B
  • 좋음
  • 세종
  • B
  • 보통
빅데이터 발견의 새로운 이름…과거 데이터 통한 미래 ‘예측’ 주목
빅데이터 발견의 새로운 이름…과거 데이터 통한 미래 ‘예측’ 주목
  • 김경민 기자
  • 승인 2020.10.23 10:22
  • 댓글 0
이 기사를 공유합니다

빅데이터 예측 [뉴스1]
빅데이터 예측 [뉴스1]

빅데이터에 의한 발견이 고도화되며 자연스레 부각된 분야가 바로 ‘예측’이다. 과거 및 현재의 데이터로 미래에 발생할 결과를 가늠할 때 예측이 가능하며 이를 위해서는 모델이 있어야 한다.

‘기업의 매출은 광고비에 비례한다’라고 하면 앞으로 얼마의 광고비를 투입하면 매출이 어느 정도 될지 예측할 수 있다.

빅데이터에 의한 예측은 사람의 계획에 의해 소프트웨어가 그 관계를 발견하는 방법을 주로 사용한다. 그리고 과거에는 분석하기 어려웠던 데이터들을 분석해 변수들을 찾아 예측력을 높이고 있다.

예측은 미래의 데이터가 아닌 과거의 데이터로 하며 따라서 새로 데이터를 만들어내는 것이 아니라 이미 존재하는 데이터 속에서 미래를 말해줄 실마리를 찾는 것이다.

일반적으로 예측이라고 하면 미래를 내다보는 점쟁이를 떠올리겠지만 그 핵심은 과거 데이터에 있다. 존재하는 모든 데이터는 과거이지 미래가 아니다.

현재 실생활에서 빅데이터를 분석해 유명 연예인의 결혼 기간을 예측하거나 음악으로 사람의 성격을 예측하기도 하고 검색어로 독감 발생을 예측하기도 한다.

연예인 등 유명인사의 결혼과 이혼은 항상 초미의 관심사로 주목받는다. 그런데 단순한 호기심을 넘어 유명인사 부부의 결혼 지속 기간을 정확히 예측해 화제를 모은 사람들이 있다.

2006년 <뉴옥타임스>의 과학 담당 기자 존 티어와 통계학자 가스 선뎀은 ‘선뎀/티어니 통합 유명인사 이론’을 고안해 이를 예측했다.

이 공식에 포함된 변수는 남편과 부인의 상대적 유명도, 이들의 나이, 교제 시간, 과거 결혼 경력, 그리고 구글에서 부인의 이름을 검색했을 때 조회 수가 높은 순서대로 나온 상위 5개 사진 중 노출이 있는 사진의 개수로 표현되는 섹스 심볼 요인 등이다.

선뎀은 이후 5년 연속 자료를 분석해 더 실증적으로 개선된 계산법을 내놓았다.

이 가운데 유명도 측정법은 구글 검색 대신 해당 여성이 <뉴옥타임스>에 언급된 횟수를 타블로이드지 <내셔널 인콰이어러>에 언급된 횟수로 나눠서 계산하는 방식으로 수정됐다.

타블로이드의 명성은 불행한 결과를 낳는다는 가정에 따른 것으로, 인기의 정도보다 어떤 종류의 인기를 얻는지가 더 중요하다는 사실을 말해주고 있다.

이 공식에 따르면 15년 이상 결혼생활을 지속할 것으로 예상된 부부는 영국의 윌리엄 왕자와 케이트 미들턴, 칼리스타 플록하트와 헤리슨 포드, 첼시 클린턴과 마크 메즈빈스키, 비욘세와 제이지 부부였다고 한다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.