[브리핑] 2024년에 머신러닝을 배우는 방법 5단계

[1] 2024년에 머신러닝을 배우는 방법 5단계

머신러닝(ML), 이제 귀에 익은 용어지만 어떻게 이해하고 또 사용할지는 여전히 어렵습니다. 오늘 브리핑 첫 꼭지에선 "어떻게 머신러닝을 배울지"에 관한 다니엘 가르시아(Daniel Garcia)의 글을 소개합니다. 다니엘 가르시아는 ML과 관련한 박사 학위를 취득한 뒤 자동차 기업에서 ML 사업부 헤드로 일하는 중이라고 합니다. Medium에 종종 정보성 글을 올리니 관심 있으신 분들은 확인해봐도 괜찮을 듯합니다. 참고로 여기선 무척 기초적인 가이드만 있으니 본격적으로 ML을 배우기 전에 가볍게 참고만 하시면 좋겠습니다.

Phyton: 파이썬은 ML에서 가장 많이 쓰이는 프로그래밍 언어라고 합니다. 모든 게 중요하지만 특히 리스트(list), 딕셔너리(dictionary), 클래스(class), 그리고 조건문과 반복문을 완벽히 학습하는 게 가장 중요하다고 하네요. 유튜브나 구글에 '파이썬 튜토리얼'만 검색해도 무척 좋은 무료 강의가 많으니 첫 단계에선 일단 그것들을 보면서 직접 코딩 연습을 해보는 게 좋다고 합니다.

수학: ML을 완벽하게 하기 위해선 수학이 필수지만, 재밌게 배우기 위해선 지나치게 수학을 걱정할 필요는 없습니다. 어느 정도 수준에 올라가더라도 미분과 행렬, 벡터의 내적에 관한 부분만 집중적으로 공부하는 걸 추천한다고 합니다. 다니엘 루이스는 Brilliant.org라는 사이트를 추천했는데요. 한국어는 지원되지 않는 듯합니다. 한국어 사이트 중에선 프로젝트 오일러라는 사이트가 괜찮아 보입니다.

개발 스택: 파이썬을 익혔다면 도구 사용법을 익힐 차례입니다. Jupyter, pandas, Numpy, Matplotlib 등이 있는데요. 행렬과 배열로 숫자를 계산할 때는 Numpy, 데이터를 그래프로 시각화할 때는 Matplotlib을 사용하는 걸 추천합니다. pandas는 테이블로 된 데이터를 처리하기에 적합한 스택입니다.

ML 배우기: 위 과정을 몇 주 정도에 걸쳐 익혔다면, 본격적으로 ML을 배울 수 있습니다. 여러 학습 과정이 있는데, 대부분 전문적인 과정이니 가볍게 소개하겠습니다. 첫째는 Andrew Ng의 머신 러닝 전문 과정입니다. 약 45만명이 수강한 명강이라고 합니다. 가장 큰 장점은 바로 무료란 점입니다. 그 다음으로 NLP 모델 구축 방법과 그에 필요한 수학을 배우고 싶다면 유튜브 Andrej Karpathy의 Neural Networks 시리즈를 추천드립니다. 당연히 무료입니다. 이것들을 모두 마스터했다면 다시 Andrew Ng의 딥러닝 전문 과정을 듣는 걸 추천합니다. 역시 무료이며 여태 86만여명이 수강한 명강입니다. Huggingface의 자체 NLP 강좌도 좋다고 하네요.

Kaggle: 실제 프로젝트를 진행하는 방법을 배우려면 Kaggle을 사용하는 걸 추천합니다. Kaggle은 도전 과제를 하나씩 깨면서 ML을 공부할 수 있는 커뮤니티입니다. 특정 과제엔 상금이 걸리기도 합니다. 실제 ML 연구 논문을 Kaggle에서 다시 구현해볼 수도 있습니다. 물론 Kaggle에서만 할 수 있는 건 아니고, 최신 ML 모델과 그게 어떻게 구현됐는지 보려면 PapersWithCode 등을 참고해도 됩니다.

How I’d learn ML in 2024 (If I Could Start Over)
I am a PhD candidate and the head of ML department in an automotive industry company, but it took me over 4 years to get to this point.

[2] 일본의 변심...'라인 매각' 요구, 사실상 철회?

라인 사태가 잠잠해지려 합니다. 일본 정부가 네이버에 요구했던 라인야후 지분 매각 조치를 사실상 철회했다고 합니다. 네이버가 제출한 보안 대책을 받아들이면서 매각을 요구할 명분이 사라졌기 때문입니다. 하지만 사태가 완전히 끝난 건 아닙니다.

💡 왜 중요하냐면: 올해 4월부터 불거진 라인 사태가 약 4개월만에 소강 국면에 접어들었습니다. 지난 2일 네이버 최수연 대표가 국회에서 "단기적으로 지분 매각을 안 하기로 결정했다"고 말한 뒤 약 10일 후에 일본 정부가 매각 요구를 철회했습니다. 다만 최 대표가 '단기적'이란 표현을 쓴 만큼 중장기적으로는 여전히 매각 가능성이 열려있습니다.

🎣 사라진 명분: 일본 정부가 매각 요구를 거둔 이유는 네이버의 보안 대책 때문입니다. 라인 사태의 발단은 지난해 11월 발생한 개인정보 유출 사건이었는데요. 일본 정부는 자국민과 국가의 정보 보안을 강화해야 한다는 명분 아래, 외국 기업인 네이버가 자국 기업인 소프트뱅크와 라인야후에게 지분을 팔아야 한다는 입장을 보였습니다. 그러나 네이버가 보안 문제를 해결하자 일본 정부도 매각 요구를 거둬 들였습니다.

🔐 기억해둘 것: 네이버가 보안 대책으로 내놓은 건 사내 거버넌스위원회 설치와 사외이사 강화 등 보안과 관련한 지배구조를 일본에 유리하게 개편하는 것이었습니다. 라인야후도 네이버와 별개로 보안 대책을 내놓았는데요. 시스템 액세스 관리 강화 등 대부분 기술적인 영역이었습니다. 한편, 한일 관계에 대한 고려가 매각 요구 철회에 영향을 줬단 분석도 있습니다. 자세한 사정은 밝혀진 게 없지만 외교부는 계속해서 "네이버의 의사결정을 최대한 존중하고 지원하겠다"는 자세를 취하고 있습니다.

[3] 역성장하는 미디어산업

국내 미디어산업이 벼랑 끝에 내몰렸단 분석이 나옵니다. 14일 방통위와 정보통신부에 따르면 '코드 셰이빙(Cord-shaving)' 징후가 곳곳에서 발견되고 있습니다. 코드 셰이빙은 '코드 커팅(Cord-cutting: 유료 방송 해지 현상)'의 사전 단계로, 유료 방송 소비가 줄어드는 현상을 뜻합니다. 지난해 IPTV VOD 매출은 전년 대비 20% 줄었고, 종합유선방송 VOD 매출도 같은 기간 19.3%나 감소했습니다. 올해 상반기에는 더 큰 폭으로 감소할 전망입니다. 게다가 국내 모든 신문, 방송 사업의 광고 매출을 합쳐도 구글의 국내 광고 매출에 못 미치는 것으로 추산됩니다.

💡 왜 중요하냐면: 유튜브와 넷플릭스의 공세로 국내 미디어산업의 핵심 지표들이 영 좋지 못합니다. 올해 1월 기준 한국인 1명의 월평균 유튜브 이용 시간은 40시간으로, 전세계 평균(23시간)의 약 2배를 기록했습니다. 넷플릭스 국내 이용자도 2019년 286만 명에서 지난해 1164만 명으로 3배 이상 증가했습니다. 그로 인해 2022년 유료방송 가입자당 평균 수익(ARPU)은 1845원으로 역대 최저 수준을 기록했습니다. SK브로드밴드 등의 ARPU는 984원까지 하락했다고 합니다.

🛍 홈쇼핑도 적신호: 방송사업자의 주요 수익원인 TV 홈쇼핑도 어려운 건 마찬가지입니다. TV 홈쇼핑은 매년 유료방송사업자에게 송출 수수료를 내는데, 수수료 총액이 유료 방송 수익의 약 33%를 차지한다고 합니다. 지난해 TV홈쇼핑이 지불한 송출 수수료는 총 1조9375억원에 달했습니다. 이에 TV홈쇼핑 업계가 수수료를 줄여야 한다고 주장하며 방송 사업의 고민은 더 깊어지고 있습니다. 안 그래도 시청자가 줄어들고 있기에 TV홈쇼핑 업계의 지적(시청자 감소에 비해 수수료가 너무 비싸다)에 반박하기 어렵기 때문입니다.

📺 변화가 필요: 상황 반전을 위해선 변화가 필요합니다. 낮은 가성비와 시청 환경의 제약을 극복해야 할 텐데요. 국내 3대 IPTV의 최저 요금제는 월 1만5000원 수준으로, 넷플릭스 최저가인 월 5500원의 약 3배입니다. 게다가 VOD 결제까지 고려하면...'스트림플레이션이 심하다'곤 하지만 유료방송에 비하면 여전히 저렴해 보입니다. 게다가 스트리밍 서비스는 방송보다 파격적이고 다양한 종류의 콘텐츠를 끊임없이 공급할 뿐만 아니라, TV뿐 아니라 모바일이나 개인 PC 등 여러 기기를 오가며 시청할 수 있습니다. 따라서 기존 미디어산업이 스트리밍 서비스와의 경쟁에서 승리하기 위해선 콘텐츠나 공급 방식을 크게 바꿀 필요가 있습니다.

콘텐츠 차별화 부족…현금 살포식 출혈경쟁만 몰두
국내 유료 방송이 역성장 국면에 접어든 것은 지난해 하반기부터다. 넷플릭스의 시청 경험에 대응할 수준의 콘텐츠를 제공하지 못하면서 ‘파이’가 줄기 시작했다. 보조금으로 국내 경쟁 업체의 가입자를 빼앗는 데 골몰하는

[4] 트럼프 피격 후...안전자산&암호화폐 선호도 동시에 올라

트럼프 후보가 피격당한 뒤 안전자산과 암호화폐 선호도가 동시에 오르고 있습니다. 트럼프의 당선 확률이 높아짐과 동시에 금융시장이 일렁이게 된 겁니다. 안전자산과 암호화폐, 서로 완전히 다른 성격을 지닌 듯한 자산의 선호도가 동시에 높아진단 점이 좀 의아한데요. 대체 트럼프 피격 사건이 안전자산과 암호화폐와 어떤 관계를 가지고 있을까요?

💡 왜 중요하냐면: 트럼프 피격 사건은 두 가지를 시사합니다. 첫째는 사회의 불안정성이 겉으로 드러났다는 점이며, 둘째는 트럼프의 당선 확률이 높아졌단 건데요. 두 가지가 복합적으로 작용하며 금융시장에선 대규모 이동이 일어나고 있습니다.

🛟 안전자산은 왜?: 안전자산은 달러, 금, 채권 등 웬만해선 가치가 크게 변하지 않는 자산을 말합니다. 따라서 사회가 불안정해질수록 최대한 안전한 자산을 가지려는 수요가 늘어나게 됩니다. 과거에도 레이건 피격 사건 등 정치적 불확실성이 커졌을 때 안전자산 수요가 늘어났다고 합니다. 하지만 이것만으론 안전자산 선호도가 늘어난 이유를 설명하기에 부족한데요. 트럼프 당선 확률이 높아지며 트럼프발 미국 재정 지출 확대, 인플레이션 지속 우려가 커진 것도 안전자산, 특히 달러 선호도를 높였습니다. 인플레이션이 지속되면 장기 금리를 내리기 어려워져 달러 강세가 지속될 수 있기 때문입니다.

🪙 암호화폐는 왜?: 암호화폐도 일종의 피난처 역할을 하고 있습니다. 암호화폐는 일단 표면적으론 외부 경제 상황과 독립적이며, 유동성과 분산 투자 가능성이 무척 크기 때문입니다. 트럼프가 암호화폐에 무척 우호적인 점도 한 몫합니다. 트럼프는 "암호화폐 대통령"을 자처할 만큼 암호화폐에 친화적인 공약을 내놓고 있습니다. 게다가 암호화폐 규제를 강력히 비판한 J.D. 밴스를 부통령 후보로 지명했습니다. 트럼프 당선 확률이 오를수록 암호화폐를 향한 기대감도 커질 수밖에 없습니다.

‘트럼프 피격’ 이후 원·달러 환율 ‘쑥’… “당분간 시장 변동성 확대”
트럼프 피격 이후 원·달러 환율 쑥 당분간 시장 변동성 확대 안전자산 쏠림 환율, 2시간만에 6원 쑥 3년물 국채는 소폭 약세 日 휴장 영향 트럼프 당선 가능성 높아져强달러 심화 美 금리 내린다 장기적 약세 주장도
Newsletter
디지털 시대, 새로운 정보를 받아보세요!
작가와 대화를 시작하세요
더코어 스토어