✍️ 에세이 14

지각에세이_김윤아

[LDA, Top2Vec, BERTopic 모형의 토픽모델링 비교 연구]- 국외 문헌정보학 분야를 중심으로  논문 분석 및 정리 1. 연구 개요Web of Science(WoS)에 등재된 문헌정보학(LIS) 분야 학술지 데이터를 가지고 LDA, Top2Vec, BERTopic 세 가지 토픽 모델링 기법을 비교함. LIS 분야 논문 55,442편의 초록 데이터를 사용해서 각 모델의 토픽 생성 결과를 분석함.2. 연구 목적과 배경LDA, Top2Vec, BERTopic의 성능과 특성을 비교함.데이터 분포, 토픽 수, 문서 할당 비율을 분석함.LIS 분야에서 각 모델의 활용 가능성을 평가함.3. 데이터 및 전처리Web of Science에서 2001~2021년간 LIS 분야 85개 학술지 논문 초록 55,44..

이커머스 산업에서 데이터 분석가, PM의 역할

이커머스(e-commerce)는 디지털 시대의 핵심 산업 중 하나로, 상품과 서비스의 온라인 거래를 통해 경제적 가치를 창출하고 있다. 우리가 익히 알고 있는 아마존, 쿠팡 등이 이 이커머스에 속한다. 이 에세이에서는 이커머스에서 데이터 분석가와 PM의 역할, 이들이 어떻게 협력하여 비즈니스 성과를 극대화하는지에 대해 논의하고자 한다. 이커머스의 발전과 데이터 분석의 중요성COVID-19 팬데믹 이후 소비자들은 온라인 쇼핑의 편리함을 경험하게 되었고, 이로 인해 이커머스 플랫폼의 수요가 폭발적으로 증가했다. 이러한 환경 속에서 데이터 분석은 고객 행동, 판매 트렌드, 재고 관리 등 다양한 측면에서 중요한 역할을 한다.  데이터 분석가는 산업 내의 다양한 데이터를 수집하고 분석하여 결론적으로 비즈니스 전략..

결석 에세이_이현진

* 9/10 결석 에세이 제출합니다   요즘 가장 자주 보는 영상 주제로는 무엇이 있나요? 저는 최근 생성형 AI를 활용해 그림을 그리거나 음악을 작곡하는 등의 영상을 자주 보곤 합니다.  이러한 영상들을 보면서 AI 기술이 창작의 영역까지 빠르게 확장되고 있다는 점이 인상적으로 다가왔고 이와 관련된 쟁점인 AI로 그린 창작물이 저작권으로 인정되는가? 와 같은 AI 창작물 저작권에 대한 궁금증이 생겨났습니다.  따라서 생성형 AI와 관련된 저작권 문제와 해결 방안을 알아보겠습니다.  I. 생성형 AI란? 생성형 AI의 정의 생성형 AI를 정확하게 이해하기 위해서 이 기술이 등장하기 전까지 AI 발전 과정이라고 할 수 있는 상위 개념들을 먼저 살펴보겠습니다.     가장 먼저 등장한 개념은 인공지능입니다...

결석에세이_강구슬

인구 절벽을 넘어서: 저출산 문제 해결을 위한 원인 분석  예전부터 저출산 문제의 심각성에 대해서는 자주 듣곤 했지만, 솔직히 말해 뉴스를 보기 전까지 그 문제가 얼마나 심각한지 실감하지 못했다. 그러다 어느 날 뉴스를 통해 한국의 합계출산율이 0.72명에 불과하다는 소식을 접했고, 이 숫자가 무엇을 의미하는지 궁금해졌다. 조사를 해보니, 합계출산율이란 한 여성이 가임 기간(15~49세)에 낳을 것으로 예상되는 평균 출생아 수를 뜻한다고 한다. 정의를 알게 되니 이 수치가 낮다는 사실은 이해했지만, 여전히 그 심각성이 피부에 와닿지 않았다. 그래서 조금 더 깊이 조사해본 결과, 저출산 문제를 구체적으로 설명하는 예시를 발견할 수 있었다. 가임기 여성이 100명 있다고 가정했을 때, 출산율이 0.72라는 ..

지각 에세이_김세연

안녕하세요:)지각에세이 제출합니다. 제가 요즘 관심이 많은 LLM의 환각 문제와 해결방안에 대해 정리해 봤습니다. LLM의 환각문제와 해결 방안 (RAG와 랭체인)LLM 환각 문제- 환각- 환각 예시- 환각문제의 원인 환각 문제 해결을 위한 RAG- RAG의 개요- RAG의 동작 원리- RAG의 장점- RAG의 한계 랭체인을 통한 환각 문제 해결- 랭체인의 개요- 랭체인의 동작 원리- 랭체인의 장점- 랭체인의 한계LLM 환각 문제환각환각은 LLM이 사실에 근거하지 않은 정보를 생성하거나 질문에 대해 잘못된 답변을 제공하는 현상을 의미한다. 모델이 훈련 데이터에 없는 정보를 생성하려고 할 때 발생한다. 환각 현상은 특히 정보의 정확성과 신뢰성이 중요한 분야에서 큰 문제이며,사용자에게 잘못된 정보를 전달함으..

지각에세이_이현진

우리는 자료 구조를 왜 알아야 할까? 이 물음은 파이썬을 배우면서 시작되었다. 파이썬과 관련된 다양한 문제를 풀면서 가장 적절한 문제 해결 방안을 위해 그 문제에 걸맞는 자료 구조를 사용해야 더 간결하고 효율적으로 문제를 풀 수 있다는 것을 깨달았기 때문이다.  이처럼 자료 구조는 개발자가 데이터를 효율적으로 사용할 수 있도록 정리하는 방법을 말한다. 각각의 자료 구조에는 장단점이 있어 어떤 자료 구조가 최선일지는 해결하고자 하는 문제의 종류와 어떤 부분을 우선적으로 최적화할지에 따라 달라질 수 있다. 프로그래밍이란 결국 알고리즘을 작성하고, 그에 맞는 자료 구조를 선택하는 것이므로 자료 구조를 충분히 이해하지 못한다면 결코 좋은 개발자가 될 수 없다. 파스칼을 개발한 스위스의 컴퓨터 과학자 니클라우스 ..

결석에세이_김규의

1. 배경 설명 자율주행자동차란 무엇일까? 자동차관리법 1의 3호에 따르면, 자율주행자동차는 운전자 또는 승객의 조작 없이 자동차 스스로 운행이 가능한 자동차를 가리키는 단어이다. 자율주행자동차는 운전자의 과실로 발생하는 교통사고 비율을 줄여 운전자와 보행자의 안전을 높이고, 운신이 어려운 교통 약자들의 이동성을 증가시키고, 혼잡한 도로 위 교통 정체를 완화시키는 역할 등을 수행하리라 기대되어 왔다. 이러한 기대와 ICT(Information & Communication Technology)의 급격한 성장에  힘입어 산업 전망 역시 밝다. 시장조사업체 마켓 앤 마켓(Markets and Markets)은 글로벌 자율주행자동차 시장 규모가 2023년 233억 달러(약 31조 원)에서 2030년 1,332억..

지각에세이_강구슬

딥페이크 범죄, 이대로 괜찮은가?1. 서론  1학기때 들었던 수업 중 AI공존윤리 교수님께서 딥페이크를 설명하실 때 이 부분을 정말 흥미롭게 들었는데요. 뉴스에서 보면 딥페이크를 통한 기술로 범죄가 상당히 많이 일어나는 것으로만 알고있었지 정확히 딥페이크가 무엇인지, 어떤 목적으로 탄생한 기술인지를 몰랐었는데, 알게되어 굉장히 새로웠습니다. 청소년들조차 이 기술을 재미로 악용하여 협박하는 사례와 성인들도 마찬가지로 악용하여 초,중,고등학생에게 해당 학생의 딥페이크 사진을 보내며 협박하고 금품을 갈취하며 심한 정신적 압박을 겪고 있는 친구들도 많다는 것을 알게 되었습니다. 어쩌면 우리의 얼굴이 합성된 이상한 사진들이 인터넷상에 우리도 모르게 유포될 수도 있겠다 싶었습니다. 저는 이 기술이 일반인들도 접근하..

지각에세이_김정현

처음 입학하였을 때는 저희 학과가 무엇을 배우는지 정말로 아무 것도 몰랐습니다. 하지만 5월이 되니, 이제 저희 학과가 어느 공부를 하는지, 나중에 어떤 직업을 갖게 되는지 대강 알 것 같습니다. 그렇지만 체계적으로 잡힌 게 아닌 지금까지 배웠던 모든게 뒤죽박죽 섞여 있어서 이번 에세이를 통해서 제대로 우리 학과에 대해 알고자 합니다. 일단 데이터 사이언스는 현대 사회에서 중요한 분야 중 하나로 자리매김하고 있습니다. 데이터 사이언스는 데이터를 수집, 분석, 해석하여 의미 있는 정보를 도출하는 과학적인 방법론을 총칭합니다. 이를 통해 기업은 소비자들에게 필요한 시스템을 개발해 이윤을 낼 수도 있고 공공기관은 시민들이 겪는 사회문제를 해결할 수도 있습니다. 수업시간에 배운 예시로는 ASF 종식방안 모색, ..

결석에세이_김윤아

(배경) 데이터에 연결된 세계 인구들은 대부분 소비 주체가 아닌 대상으로써 연결되고 있다는 것이 문제점이다. 개인의 데이터들은 대기업에 의해서 수집이 되어 마케팅에 활용되었다. 개인은 시각문화 선택기준으로 자신의 데이터를 활용하는 문제에 직면했다. 최근 개인 정보 활용이 사회적 문제가 되어 데이터 유출을 차단하는 것이 선택 가능해졌다. 현대인은 데이터의 홍수 속에서 살아남아야 하며, 살아남는 방법은 디지털 문명을 차단하는 문맹이 될 것이 아니라 개인 스스로 구축한 데이터를 활용하는 데 있다. 일반인들은 개인의 기준으로 선택에 활용되는 것이 어렵다는 한계점에 있다. 소셜미디어에 구축된 개인의 이미지 데이터를 소비 주체로 활용할 수 있는 방법이 필요하다. 개인의 시각문화 선택기준을 찾는데 개인의 이미지와 미..