본문 바로가기

학교공부

(9)
machine learning >> clustering(1) Unsupervised Learning : unsupervise learning이라는 말은 supervisor가 없다는 뜻이다. 즉 input X를 위한 'label'이 존재하지 않는다. 종류 Density Estimation(KDE): y label은 필요없고, x data만 필요하다. Clustering : kMeans, MoG Dimension Reduction : x data가 주어졌을 때, 높은 차원의 데이터를 낮은 차원의 데이터에 projection 해주는 것이다. 이건 'compression'이랑 비슷하다. Factor analysis: 주어진 signal을 발생시키는 데에 주요인이 무엇인가? Representation Learning Clustering data..
Training할 때 오류와 해결법(Dataloader killed, Connection reset by peer, Exception 0 SISKILL) 처음으로 깃헙에서 딥러닝 오픈소스를 다운받아 실행을 하는 것을 시작으로 성능 개선을 위해 공부하고 연구(??)해 볼 기회가 생겼다. 하지만 제일 처음 다루게 된 데이터가 하필 엄~청 큰 데이터라 정말 많은 고비들이 있었다....😭😭😭 그냥 돌려보는 건데... 모든 게 처음인 나에게 너무 많은 시간이 필요하더라... 진짜 시작조차 못했는데 1. RuntimeError : DataLoader worker (pid ~~) is killed by signal: Killed. 진심 이 오류때문에 구글에 치면 나오는 글은 모두 읽어봤다. 1.1 에러의 원인 1.2 시도 1) batch size 줄이기❌ 구글에 검색해보니 가장 먼저 나오는 해결법이 batch size를 줄이라는 말이 있어서 512부터 32까지 줄여서..
실전프로젝트2 >> 소프트웨어 개선 과제(1) 1. 문제점 좀 더 폭넓은 소비자층 지그재그는 대한민국 여성 10대 20대를 대상으로 많은 사랑을 받고 있는 것은 사실이며, 지그재그와 같은 어플리케이션 특성 상 지속적인 이용자 수 또한 보장될 수 있습니다. 하지만 소비자층이 한정적이다 보니 성장가능성에 대한 기대를 하기 어렵기에 더 넓은 소비자층을 확보하는 것이 필요하다고 생각합니다. 가격비교 시스템의 부재 지그재그에서 판매중인 상품과 같은 상품을 네이버 쇼핑과 같은 다른 쇼핑몰 사이트에서 가격 확인을 하였을 때 더 싼 가격에 판매되는 것을 쉽지 않게 발견할 수 있습니다. 물론 지그재그에서 쉽게 구할 수 있다는 편의성에 의해 신경 쓰지않는 커스터머들이 존재하기도 하지만 지그재그에 대한 신뢰도가 떨어져 더 이상 지그재그를 찾지 않는 상황 또한 발생한다고..
실전프로젝트2 >> 소프트웨어 개선 과제(2) 2. 개선안 1. 첫번째 문제 연령대. 지그재그가 가진 큐레이션 서비스 특성 상 지그재그 어플리케이션 사용자에 대한 데이터를 기반으로 사용자들의 요구를 채워주는 구조이기 때문에, 4050 연령대의 이용자에 대한 정보를 필요로 합니다. 4050대 여성들을 대상으로 한 시장 조사를 통하여 충분한 데이터 확보와 사전에 40대 50대 여성들을 구해 쇼핑몰 이용 로그들을 구한다던지 이러한 다양한 노력들을 통한 빅데이터 구축이 가장 우선시 되어야 할 것으로 보여집니다. 2. 두번째 문제는 가격비교 시스템 도입으로 해결할 수 있습니다. 하지만 가격비교 시스템 도입 시 주의할 점이 있습니다. 사실 지그재그에는 개인 쇼핑몰, 소상공인들이 많다 보니 상품의 가격경쟁을 심화시킬 우려가 있습니다. 이를 위해서 지그재그에서는 ..
실전프로젝트2 >> 소프트웨어 개선 과제(3) 3. 새로운 아이디어
실전프로젝트2 >> 소프트웨어 분석 1. 소프트웨어 선택 배경 어느 순간부터 식료품, 옷 뿐만 아니라 다양한 제품을 대상으로 IT기술을 기반으로 한 서비스들을 통해 국내 유통 산업 혁신이 일고 있으며, 특히 모바일 쇼핑 어플이 우리의 삶에 깊이 자리 잡고 있다. 이는 특히 우리의 소비 패턴 또한 바꾸는데 일조를 하고 있다. 그만큼 우리에게 미치는 영향력이 크다고 생각해서 모바일 쇼핑과 관련된 소프트웨어를 선택하게 되었고, 그 중에서도 특히10,20대가 가장 많이 사용하는 쇼핑 어플이자 나조차도 정말 많이 사용하는 어플인 '지그재그'를 이번 실전프로젝트2의 소프트웨어 분석 주제로 선택하게 되었다. 2. 소프트웨어 특징 : "지그재그"는 패션/테크 기업으로서 3700여 개의 동대문 의류 기반 여성 쇼핑몰을 한데 모아 이용할 수 있는 플랫폼이다..
실전프로젝트2 >> CTAT 활용 및 후기. CTAT은 크게 1. html 편집창으로 사용자가 사용할 인터페이스 만들기. 2. model의 종류에 따라 tutor 만들기 3. 원하는 기능 추가로 나뉘는데 나는 일단 간단하게 html을 만들고 example-tracing tutor의 tutorial만 따라해보았다. html편집창에서 쉽게 사용자 인터페이스를 만들고, 사용자의 인터페이스에 들어오는 인풋 값에 따라 tutor의 행동들을 지정해주면 된다. (아래의 사진과 같이 인터페이스는 html코드로 편집도 가능하다. ) tutorial에 나온대로 1/4 + 3/8을 인터페이스의 초기상태로 지정해주고 cognitive tutor authoring tool에서 어떤 인풋은 답으로, 어떤 인풋은 오답으로 설정을 해줌으로써 tutor를 만들어준다. 그렇게 되..
실전프로젝트2 >> CTAT 설치 관련 https://github.com/CMUCTAT/CTAT/wiki/Quick-Start#download-ctat CMUCTAT/CTAT Cognitive Tutor Authoring Tools. Contribute to CMUCTAT/CTAT development by creating an account on GitHub. github.com 1. cloud app을 설치하고 setup 해야 합니다. 구글드라이브 app 설치 구글드라이브 app에 CTAT이라는 폴더를 만들어 줍니다. 나의 로컬 드라이브에 있는 CTAT폴더와 구글 드라이브의 CTAT폴더를 동기화해줍니다. 2. github에 있는 CTAT_macos_4_3_0.dmg 설치 java jdk 설치 후 설치. 3. 설치 완료