분류 전체보기 462

지각에세이_김윤아

[LDA, Top2Vec, BERTopic 모형의 토픽모델링 비교 연구]- 국외 문헌정보학 분야를 중심으로  논문 분석 및 정리 1. 연구 개요Web of Science(WoS)에 등재된 문헌정보학(LIS) 분야 학술지 데이터를 가지고 LDA, Top2Vec, BERTopic 세 가지 토픽 모델링 기법을 비교함. LIS 분야 논문 55,442편의 초록 데이터를 사용해서 각 모델의 토픽 생성 결과를 분석함.2. 연구 목적과 배경LDA, Top2Vec, BERTopic의 성능과 특성을 비교함.데이터 분포, 토픽 수, 문서 할당 비율을 분석함.LIS 분야에서 각 모델의 활용 가능성을 평가함.3. 데이터 및 전처리Web of Science에서 2001~2021년간 LIS 분야 85개 학술지 논문 초록 55,44..

[WIDA] 2차_1학년_연구 계획서

안녕하세요. 저희 1학년조는 중간고사 이후 새로운 주제의 프로젝트로 연구를 진행하려고 합니다. 이번 두 번째 프로젝트는 10월 29일부터 11월 26일 전까지 진행하고자 하며, 캐글의 인도, 미국 데이터셋을 활용해 당뇨병 원인 예측을 주제로 삼았습니다. 이를 통해 가능하다면 간단한 모델도 만들어 볼 예정입니다. 주차별 연구 계획 및 연구 필요성은 파일에 첨부하였습니다.

[WIDA] 1학년_3차 보고서

[주제] 인도 데이터 셋을 기반으로 당뇨병 예측하기 [목표] 미국과 인도의 데이터 셋 시각화 후 당뇨병과 속성 간의 상관관계 파악, 인도 데이터 셋 당뇨병 예측 모델 만들기 [진행 상황]미국 분석 결과: 당뇨병에 대한 속성 분석 결과 HighBP, HighChol, BMI, Stroke, GenHlth, PhysHlth, DiffWalk, Age에 유의미한 상관관계가 있음을 파악. 나머지 속성들은 관계가 없거나 약함.인도 분석 결과: 이상치 확인 후 평균 값으로 대체, Outcome 0,1 비교 시각화를 중점으로 시각화 진행. 속성들 중 혈당, 나이, BMI, 인슐린, 유전 가능성은 당뇨병과 뚜렷한 연관성을 보이지만 혈압은 당뇨병 여부와의 관련성이 약하다고 판단.[향후 계획] 인도 데이터 셋 당뇨병 예측..

[WIDA] 2학년_4차 보고서

주제 :  김(Seaweed) 이미지 기반 이물질 검출 및 품질 분류 [ 전체 프로젝트 목표 ]김의 이미지를 학습시켜,(1) 김이 결함이 있는지 없는지 이진분류하는 모델을 제작(2) 결함 있는 이미지로 분류된 이미지에서 결함 위치의 바운딩 박스를 정확히 예측, 클래스 분류하는 모델 제작 [ 현재 진행 상황 ]- 데이터 인사이트 추출: 데이터 결함 전체 클래스 수 시각화 : 데이터 결함 크기 시각화: 데이터 결함 위치 시각화>> 가장자리보다 중앙쪽에 위치함 - RetinaNet : One-Stage 모델의 약점을 해결하기 위해 Focal Loss라는 새로운 손실 함수를 도입하여 정확도를 크게 향상 One-Stage란?One-Stage 모델Two-Stage 모델이미지의 모든 위치에서 객체의 위치와 종류를 한..