목록분류 전체보기 (121)
가볍게 배우고 깊게 즐기고 오래 남기기

[변동성 척도] – Measure of Variability * Standard deviation(표준편차) → Variance의 제곱근, 평균에서이 얼마나 분산되어 있는지 검토 가능 * Coefficieat of variation (변동계수): (=표준편차/평균*100), 표준편차를 상대적인 값으로 표준화 시킨 값 → 상대값으로 변환해 규모의 효과 상쇄할 수 있음 * IQR (Interquartile range): (=Q3-O1) → Python / R 등의 통계 시각화에서 많이 활용하는 Boxplot [연관성 척도] – Measure of Association ※ 특잇값 발견(정규화 활용) → Z-score = (x-m)/s ※ 그룹 평균/분산 – 계급의 Median을 대표값으로 활용한다 * 통계적 ..

* 통계(Statistics) : 어떤 상황에서 보여주는 자료(Data)로부터 문제나 다양한 의미(Information)를 정량적으로 도출해내는 방법 (to extract information from data) → 자료 수집/정리/요약 외에 일부 데이터로 전체를 추정할 수 있는 가공의 영역도 포함됨 1. 데이터 (Data)의 정의 (통계적 관점에서) : 변인(Variable)으로부터 관찰된 값 (the observed values of a variable) ※ Variable(변수, 변인) : 모집단 또는 표본이 가진 특성 → X, Y, Z로 각각 표현 The values of the variable (변수값) : 변수가 가질 수 있는 값의 범위 → (ex) student marks (0,100) * ..

바쁘다 바빠 끝이없다 공부 Slack GPT 개발 + 프롬프트 엔지니어링 투입 여태 체크한 것들과 앱개발한 건은 나중에 전체 정리하기로 하고 학습시키는 데이터 개발 생성도 파이썬으로 개발하면 되지만 앱 연동이 우선이니 일단 GoogleSheet에서1차 정제 들어가는 것이 빠르게 삶을 사는 방법 확실히 사내에 활용하기에는 기존 모델 내에 자잘한 유연화에 심어주는 형태가 제일 좋긴 한 것 같다. 세션마다 학습시키는 것은 너무 비효율적이다. GPT를 활용하기 위해서 필수 전제 조건 : OpenAI API Key 획득 https://platform.openai.com/ 가입 후 https://platform.openai.com/account/api-keys 에서 개인 API Key가 있어야 활용 가능하다. (아..

os.environ.get("SLACK_BOT_TOKEN") 이렇게 명확하게 알고 있을때는 바로 변수에 바로 값을 담아서 활용할 수 있지만 이 토큰 저 토큰 이 path 저 path 가끔 정확한 풀네임이 아리까리 할 때가 있다. 그럴 때 주로 사용하는 코드 코딩하다가 파이썬 내에서 내 시스템 내 퀵하게 시스템 환경변수 리스트를 알고싶을 때 , 내가 쓰는 쿼리 (필터) (= 제어판으로 가서 검색해서 일일이 찾기 싫을 때) 1) 원하는 딱 하나를 찾을 때 (ex) JAVA_HOME path 찾기 import os env_var = os.environ print("User's Environment variable:") x = dict(env_var) for key, value in x.items(): if k..

진작부터 가지고 놀아보고 싶다는 생각은 했는데, 다른 것 때문에 바쁘고 정신없어서 느즈막히 건드려보는 딥페이크 API https://arxiv.org/abs/2203.14367 Thin-Plate Spline Motion Model for Image AnimationImage animation brings life to the static object in the source image according to the driving video. Recent works attempt to perform motion transfer on arbitrary objects through unsupervised methods without using a priori knowledge. However, it rema..

예정된 시간보다 내 개인으로 쓸 시간이 생긴 김에 서울 도서관을 들러 책을 빌렸다. 김영익 교수님의 공저라는 부분도 마음에 들었고, 2023년 초입에 다시 복기해보는 20~22년 투자 예측이 특히 의미 있을 것 같았다. '2020~2022 앞으로 3년, 투자의 미래'는얼마나 맞았는지 그리고 그때 무엇을 보고 판단을 했는지 참고해볼까 싶었다. 전체적으로 차트를 보기도 하고 경제지표를 보기도 하는데 모두 내가 관심을 두는 부분이라 딱 맞는 책이었다. 19년 4분기 시점에 작성한 당시의 예측들 : 주가 코스피 시장흐름과 전망 근거 * 20년 상반기 맞이와 급락 보다 선행 하락 가능성이 높고 고점 대비 큰 폭의 하락 예상 (1800~1900대 터치) * 21년 전에는 바닥을 다지고 몇 년간 저점 높이며 상승 지..

LangChain이란 거대규모의 자연어와 텍스트를 학습한 대규모 언어 모델 LLM(Large language model) 기반으로, AI와 블록체인 기술을 연계해 언어 학습을 가능하게 하는 분산언어 학습 플랫폼이다. 더 명확하게 이야기 하자면 LangChain은 블록체인 기술을 이용하여 분산 네트워크를 구축하고, 학습 내용은 블록에 저장함으로써 보안성과 투명성을 확보하는 구조를 갖는다. 그리고 블록체인 고유의 특성에 맞게 사용자들은 학습한 내용을 추적하고, 학습 기록을 다른 사용자들과 공유할 수 있다.. LLM은 마이크로소프트를 비롯한 구글, 메타 등 글로벌 펌은 물론, 국내 Naver, SK 등 한국어 최적화된 GPT 개발에 힘을 쏟고 있다. MS가 ChatGPT를 삼키면서 앞으로 어떻게 쓸 것인가 장..

PowerBI는 파이썬 스크립트 활용시에도 약간 고구마 답답한 부분들이 있고, Tableau나 MSTR dossier를 활용하다가 지금 일하는 이 곳에서 PowerBI로 입사 직전 확정되었다길래 처음엔 답답했지만 새로운 툴을 이해하는 겸, 어차피 진짜 일하는 사람은 툴을 가리지 않는다고 생각하고 여러가지 또 새로운 시도를 하고 있다. 이 곳에서 만난 PowerBI는 Tableau보다는 비교적 시각화 자유도나 GUI 내에서 변수 특성 변화하는 것들이 조금 덜 직관적인 부분이 있다거나 DAX 코드와 power query를 혼합해야 하는 경우들은 있지만, 인사이트와 개발을 동시에 진행하는 입장 기준에서는 꽤나 요긴한 GUI 영역들이 있었다. Data cleansing 과정이나 Power query 연계하는 부..

말 그대로 확장프로그램이나 웨일 같은 프로그램 없이 브라우저 풀 스크린샷 찍는 법 (full screenshot code) 이제 꽤나 익숙할 크롬 개발자도구 (F12) 누르면, 우측상단에 꽤나 요긴한 기능 "Run command"를 클릭 (단축키 : ctrl + shift + P 또는 command + shift + P) 여기서 "Capture full size screenshot " 입력 하면 하단에 자동으로 png로 자동다운로드가 된다 (결과)--------------------------------------------------------------------------------------------------------------------------------------------------..

포트폴리오 최적화와 자산 배분 전략에 용이한 riskfolio 모듈에는 꽤 잘 만들어놓은 도넛차트가 있는데, 이게 Colab이나 최신화된 환경에서 우리가 보고 싶은 이 화면 공식문서의 코드를 그대로 써도 나오지 않는다. 설치할 때 잘 째려보면 matplotlib.pyplot을 사용하고 있음을 알 수 있는데 이 모듈이 참조하는 과정에서 normalize 파라미터가 문제가 있어보였다. riskfolio모듈의 plot_pie에는 입력변수가 자체가 정의되어있지 않기 때문에 백날천날 이 함수의 파라미터로 두드려봐야 큰 의미가 없다. 아마 개발시점의 pyplot의 개발 구조와 현 시점의 개발 구조가 달라져서인 듯 한데, 애석하게되 단순히 기존 matplotlib을 삭제하고 과거 버전으로 회귀한다고 해서 해결되지 않..

계절학기 과제 하긴 해야지 하면서 슬슬 자료 스크리닝만 하고 있다가 이 묘하게 정성스러운 404 뭐야........ 저거 계속 보면 왠지 소리도 나는 것 같다 아무튼 23년이다. 동기 모두가 너무 과포화 과호흡오게 달렸던 2년이 끝났고, 작심삼일용이라도 뭐라도 정하게 되는 새해 목표는 하나도 생각하지 않고 밀린 잠을 몰아자는 게 우선인 1일이었다. 더욱이 올해는 갑자기 중간에 나이가 게릴라로 줄어들 예정이니 몇 살이냐는 질문에 뭐라고 해야 하나 잠깐 고민하다가 나는 몇년생이오 하는 그런 기이한 해. 올해 계획은 중순까지 딱히 정한 바는 없다. 모 아니면 도인 내 성격상 한 번 놓으면 기억에서도 삶의 패턴에서나 거의 완전히 지워버리다보니 완전한 한량으로 전환하지 않기 위한 소프트랜딩이 필요했다 지난 2년 ..