AI도 트렌드다! 요즘 핫한 인공지능 기술 활용 모음.zip

끝없이 발전해나가는 AI, 업계에서 화제인 인공지능 기술 활용 사례들을 모아왔습니다.
서지윤's avatar
Apr 25, 2024
AI도 트렌드다! 요즘 핫한 인공지능 기술 활용 모음.zip
안녕하세요, 코드잇 스프린트입니다.
 
여러분은 인공지능 기술을 어디까지 활용해 보셨나요? Adobe Photoshop ‘생성형 이미지’, 숏폼 필수 ‘AI 목소리’, 업무를 보다 간편하게 해주는 툴의 ‘자동화’ 등… 인공지능이 발전해 나감에 따라, 우리가 일상에서 보게 되는 AI 기술도 더욱 다양해지고 있는데요. 세상을 더욱 이롭게, 편하게 만드는 ‘요즘 핫한’ 인공지능 활용 사례를 소개합니다. 🤖
 

 

#시리 대신, 제가 알아서 틀어드릴게요!

 

- Spotify의 AI 플레이리스트

스포티파이는 AI 기술에 공을 들이고 있습니다. 'AI DJ' 등 여러 AI 기능을 개발하고, 유저의 스트리밍 경험을 향상하고자 하죠. 이번에는 유저의 프롬프트에 기반한 생성형 AI 플레이리스트 기능을 선보일 예정이라고 합니다. 이를 구현하기 위해 대규모 언어 모델을 사용해 유저 의도를 파악하고, 히스토리와 선호도에 맞는 플레이리스트를 생성한다고 하는데요.
 
spotify의 메인 화면 (사진 출처: unsplash)
spotify의 메인 화면 (사진 출처: unsplash)
 
사용자는 기존의 플레이리스트에서 AI 기능을 활용해 ‘러닝머신을 10분 더 뛰게 만드는 에너지’, ‘좀 더 차분한 분위기’ 등의 원하는 분위기, 느낌을 입력하게 됩니다. AI는 이를 반영하여 플레이리스트를 수정하고, 더 나은 결과를 제공해요.
 
에디터도 여느 음악 스트리밍 어플에서 ‘알고리즘’의 한계를 느꼈던 적이 있는데요. 나의 기분 변화 패턴이나 주기를 기억해 뒀다가, 노래를 추천해 주는 기능이 필요했습니다. ‘2년 전에는 한 곡 재생할 정도로 좋아했던 노래’, ‘추억의 2010년대 OST’ 등… 다양한 곡을 알아서 끌어올려 주는 기능 말이죠. 어플 속 AI가 스스로 학습하여 ‘맞춤형 곡 추천’을 선보인 지는 꽤 되었지만, 한 번도 나의 음악 취향을 꿰뚫었다 느낀 적은 없었던 분이라면! 추후 해당 기능을 사용해 보세요. 👂🏻
 
 

 

#마음으로 듣는 한 아이돌의 노래

 

- 그룹 ‘빅오션’의 AI 음원

지난 20일, ‘장애인의 날’에 3인조로 데뷔한 아이돌 그룹이 있습니다. 청각 장애인으로 구성된 ‘빅오션’은 H.O.T.의 '빛'을 리메이크한 곡으로 첫 무대를 만들었는데요. 중간중간에 수어를 섞어가며 작품을 꾸몄습니다. 우선, 여기서 빅오션의 퍼포먼스 영상을 감상해 보세요. 👀
 
그룹 ‘빅오션’의 단체 사진 (사진 출처: 빅오션 나무위키)
그룹 ‘빅오션’의 단체 사진 (사진 출처: 빅오션 나무위키)
 
겉으로 보기에는 평범한 아이돌 무대같은 빅오션의 음악 방송. 하지만, 이들의 음원에는 특별한 무언가가 있습니다. 바로, 해당 음원이 멤버들의 목소리를 학습한 AI 기술을 활용하여 제작되었다는 것인데요. 📀 청각 장애로 인해 정확한 음정을 잡기 어렵기 때문에, 인공지능의 도움을 받았다고 합니다.
 
이들은 한국어, 영어 수어와 국제 수화로 노래합니다. 피치, 음정 등 음악을 하는 입장에서는 사운드로 신경 써야 할 것이 아주 많을 거예요. 이러한 신체적 한계에도 불구하고, 그룹만의 특색있는 무대를 보여준 빅오션에게 응원의 박수를 보내고 싶습니다. 희망뿐만 아니라, 무언가 도전하고자 하는 이들에게 새로운 전환점이 되었을 것 같습니다. 🎙️
 
 

 

#재료만 준비하세요! AI가 추천하는 오늘의 레시피

 

- Google의 AI 요리 레시피 생성 서비스

구글이 제공하는 AI 요리 레시피 생성 서비스, food mood입니다. 서비스 이름에서도 어렴풋이 느껴지듯이 그날의 무드, 상황에 따른 요리 레시피를 만들어줍니다. 메인 요리, 디저트 등 요리의 카테고리와 인원, 그리고 2개의 국가를 선택하면 ‘오늘의 레시피’를 생성해 주는데요. 🥯
 
요리를 시작하기 전, 우리는 메뉴를 선정한 다음 레시피를 검색하죠. 이건 아주 당연한 루틴입니다. 하지만, 구글은 정반대의 루틴을 내세웁니다. ‘하루가 어땠는지, 기분이 어떤지, 어떤 생각을 하고 있는지’를 먼저 생각하고, 그 다음 메뉴를 정하는 것! 👩‍🍳
 
사용자의 상황에 따른, 새로운 레시피를 생성하는 과정 (GIF 출처: Google for Developers)
사용자의 상황에 따른, 새로운 레시피를 생성하는 과정 (GIF 출처: Google for Developers)
 
여러분은 시험을 망쳐서 아주 스트레스를 받은 상태입니다. 매운 건 못 먹고, 기름진 건 싫고, 너무 달거나 짠 건 땡기지 않는 지금. 여러분의 ‘Status’를 그대로 적어 보는 거예요. AI는 이를 기반으로 새로운 레시피를 개발합니다. 이어, 재료와 레시피가 적힌 페이지를 제공해요.
 
해당 서비스는 개인 가정뿐만 아니라, 일반 식당이나 서비스에서도 요긴하게 쓰일 전망입니다. (식당에서 선보이는 ‘오늘의 특별 메뉴’라면 구미가 당길 것 같죠? 👩🏻‍🌾) Food Mood는 오픈 소스로 제공된다고 하며, 다른 기업이나 현지 시장이 해당 서비스를 적절히, 알맞게 활용할 수 있도록 더욱 디벨롭 될 예정이라고 해요.
 
 

 

#모두가 더 나은 일상을 누릴 수 있도록

 

- Open AI의 보이스 엔진

챗 GPT로 이미 이름을 떨친 Open AI. 이들은 인공지능과 관련된 서비스를 계속해서 개발, 구축해 나가고 있는데요. 최근 개발 중인 서비스 중 가장 주목을 받고 있는 ‘보이스 엔진’을 소개합니다. 해당 모델은 음성 복제가 가능하며, 약 15초 분량의 음성을 입력하면 그와 유사한 음성을 자연스럽게 생성해 준다고 해요.
레퍼런스 오디오를 AI로 생성하여 제공 (출처: Open AI 블로그)
레퍼런스 오디오를 AI로 생성하여 제공 (출처: Open AI 블로그)
 
여기에는 모두가 입 모아 말하는, ‘가장 기대되는 것’이 있습니다. 언어 장애가 있는 사람의 데이터를 사용하여 더욱 자연스러운 소통을 할 수 있다는 것인데요. 예를 들어, 파파고의 번역 음성으로만 대화할 수 있던 한국인이 있습니다. 같은 번역 문구지만, ‘본인의 고유 음성’으로 소리 난다면 얼마나 자연스러울까요? 우리는 대화하면서 상대의 목소리를 기억하고, 그들만의 느낌과 톤을 전달 받습니다. 똑같은 소통이더라도, 기계가 읽어주는 느낌이 덜해진다면 더욱 좋겠죠?
 
해당 기술은 악영향의 우려로 인해 일반인의 접근은 제한하며, 아직 일부 개발자만 테스트 할 수 있다고 하는데요. Open AI에서 제공하는 샘플은 여기서 확인해 보세요!
 
 

 

#디테일이 만드는 개선의 차이

 

- 딥비전스의 AI 미세먼지 측정 솔루션

봄철, 전국적으로 악명을 떨치는 미세먼지. 😷 이맘때쯤이면 수치를 알려주는 어플이나 검색 사이트를 이용하는 분들이 많을 텐데요. 그만큼 미세먼지는 장기적으로 인체에 악영향을 미치고, 국가적 차원에서 관리해야 하는 문제 중 하나입니다.
 
미세먼지로 가득 찬 시내 (사진 출처: freepik)
미세먼지로 가득 찬 시내 (사진 출처: freepik)
 
성동구는 서울시가 운영하는 도시대기측정소 1개만으로는 동네 곳곳의 실시간 미세먼지 정보를 제공하기에 한계가 있다고 판단했고, 이에 ‘딥비전스’의 AI 영상분석 신기술을 활용한 미세먼지 지도를 구축 중에 있다고 해요. 성동구는 해당 기술로 관내 고농도 미세먼지 발생 지역과 상습 미세먼지 발생지역을 파악하고, 저감 조치를 시행하는 데 활용할 예정이라고 합니다. 🤧
 
스타트업 딥비전스의 AI 미세먼지 측정 기술은 CCTV 혹은 폐휴대폰에서 확보한 영상 데이터를 인공지능으로 학습하여, 미세먼지 농도를 측정합니다. 이를 활용하면 미세먼지 측정 비용을 크게 절약할 수 있어, 몇 안 되는 측정 장비에 의존하던 방식을 개선할 수 있다고 하는데요. 확실히 예산이 적어지면 설치할 수 있는 기기의 수가 늘어나게 되니, 더욱 디테일한 미세먼지 지도를 만들 수 있겠죠?
 
딥비전스의 측정 AI 기술에 대해 자세히 알고 싶다면, 이 영상을 참고해 보세요! 👀
 
 

 

#언어의 장벽을 더욱 빠르게 넘어서는 법

 

- SK텔레콤의 AI 동시 통역 솔루션

해를 거듭할수록 한국을 찾는 외국 관광객들이 늘어나는 듯한데요. 서울의 명동, 부산의 남포동 등 도시마다 특히 유명한 관광 명소가 있습니다. 🤠 쇼핑, 대중교통, 숙소 등 한국의 시스템을 이용하는 외국인은 많지만, 번역/안내소는 그러한 수요를 뒷받침해 줄 만큼은 아니죠.
 
롯데월드몰 안내데스크에 설치된 ‘트랜스 토커’를 사용하는 외국인 (사진 출처: SK 텔레콤 뉴스룸 자료)
롯데월드몰 안내데스크에 설치된 ‘트랜스 토커’를 사용하는 외국인 (사진 출처: SK 텔레콤 뉴스룸 자료)
 
이러한 문제를 해결하고, 외국인 관광객이 한국에서의 하루를 더 원활히 보낼 수 있도록 SK텔레콤에서는 AI 동시 통역 서비스 ‘트랜스 토커’를 선보입니다. 영어, 한국어를 포함하여 13개 언어를 동시 지원해요. 국내 언어 지원 스크린의 경우 가장 수요가 많은 영어, 일본어, 중국어가 대부분인데요. 13개국의 언어를 지원한다는 것이 큰 장점입니다.
 
외국인 관광객이 스크린 앞에 설치된 마이크에 본인의 언어로 질문하면, 한국어로 번역된 문장이 안내데스크의 스크린에 표시됩니다. 이후 직원이 한국어로 답변하면, 다시 실시간으로 변환되어 모니터에 나타나죠. 이는 주위 소음을 최대한 제거하는 ‘지향성 마이크’, PC 등으로 구성된 기술이에요. 이 외에 음성 인식, NPU, 번역 엔진, LLM 등의 기능을 적용했어요.
 
해당 기술이 점차 발전되어, 반대로 한국인이 낯선 나라에 가게 될 때도 동시 통역이 가능하게 된다면… 얼마나 좋을까요? 🥴 
끝이 보이지 않는 인공지능 기술의 발전, 긍정적인 방향으로의 전진을 응원합니다!
 
 

 

참고 문헌

 
Share article
Subscribe Newsletter
Stay connected for the latest news and insights.
RSSPowered by inblog