전체 글(41)
-
세계 심리학 필독서 30
세계 심리학 필독서 30 - 사토 다쓰야 (발달심리학, 인지심리학, 사회심리학 각 분파의) 심리학의 흐름에 따라 주요 인물과 저서를 요약한 책이었다. 교육심리학에서, 교직과목에서 자주 보았던 학자도 있어서 반갑기도 했다. 아무래도 짧게 요약이 되어 있어 깊이 알긴 어려웠지만, 모르던 학자도 (이해가 잘 가진 않지만...) 눈으로 익힐 수 있어서 좋았다. 이 책을 읽으면서 더 읽고싶은 학자의 책들의 목록을 뽑아보았다. 1. 매슬로-동기와 성격 2. 대니얼 카너먼-생각에 관한 생각 이 사람이 했던 말이 너무 감명깊어 적어본다. '행복에 필요한 요소는 너무도 다양하고 복합적이어서 우리 인생이 날씨 (미국의 캘리포니아 지역에 사는 사람들은 중서부 지역 사람들보다 행복하리라고 생각한다) 하나만으로는 결코 행복해질..
2023.11.20 -
빅데이터분석기사 준비 D+3
세상을 읽는 새로운 언어, 빅데이터-조성준 문서의 전처리 단계는 다음과 같다. 1. 정형화되어 있는 데이터로부터 도메인에서 사용되는 단어를 추출해서 사전에 추가하는 것 2. 이미 구축된 사전을 이용하고, 두 가지 문자열 모듈을 활용하여 문서를 유의미한 말뭉치로 나누기, 동의어와 약어 처리하기. 3. 불용어 제거하기 4. 엔그램 처리(연속된 단어가 모여 하나의 객체를 이룰 경우 하나의 용어로 간주하기)
2023.11.16 -
빅데이터분석기사 준비 D+2
세상을 읽는 새로운 언어, 빅데이터-조성준 머리에 잘 입력이 안되어서 정리를 하고자 한다. Task: 인사이트를 도출하기 위해 데이터에 수행하는 작업 묘사 > 진단 > 예측 > 처방 1단계: 묘사 2단계 진단 -시각화: 스팟파이어(spotfire), 태블로(TABleau) 예) 에어컨 실내기의 24시간 동안의 작동 -연관분석: 어 프라이오리(A Priori) 예) 오븐과 연관검색어 '실패', '엄마', '간식' 등 -클러스터링: K-평균 군집화(K-Means-Clustering), 계층적 군집화(Hierarchial Clustering), SOM 신경망(Self Organizing Map Neural Network) 예) 신용카드사의 우수고객 30명 성향별로 나누기 3단계: 예측 -예측, 분류 둘 다: ..
2023.11.16 -
빅데이터분석기사 준비 D+1
51가지 통계방법-칸 다미오 시가 야스오 외 우리나라의 대부분 통계 책은 일본 책을 번역한 것이 많다. 아무래도 수학을 일본에서 가져와 그런거겠지. 덕분에 귀여운 그림과 함께 통계 방법들을 훑을 수 있어서 좋았다. 초반에는 이해가 잘 되었는데 후반으로 넘어갈수록(검정부분...-평균값 검정, 비율 검정, 상관 검정, 다중회귀분석) 어려워서 검은 것은 글씨고 숫자요, 흰것은 종이였다. 그래도 이거(51가지 통계방법) 읽고 빅데이터 분석기사 유튜브를 보니 한번 눈으로 봤던 것이어서 (그나마) 이해가 좀 잘 되었다. 통계 교과서(행동과학을 위한 통계의 핵심)도 함께 공부하는 중인데(이건 심리학과 1학년이 볼 것 같은 교과서다) 아직 초반이라서 괜찮다. 현재 목표는 24년도 빅데이터 분석기사 필기+실기합격, +데..
2023.11.16 -
통계와 빅데이터
통계학, 빅데이터를 잡다-조재근 4차 산업혁명 시대에 떠오르고 있는 빅데이터 분야. 데이터가 넘쳐나고 있는 시대에 많은 데이터를 어떻게 활용하느냐가 중요하다. 학제간 융합된 연구에서 데이터 활용 시 통계는 중요한 역할을 한다. 어떤 연구에서든 해석을 할 때 통계를 바탕으로 하기 때문이다. (그렇기 때문에, 활용하는 사람에 따라 무기가 될 수도 있다.) 기존 통계분석과 빅데이터 통계분석의 다른 점을 찾는다면, 빅데이터는 훨씬 더 다양하고 질적인 특성을 찾아낼 수 있다는 것이다. 다만 '만능' 이라는 생각은 경계해야 할 필요성이 있다. 빅데이터를 통해 새롭게 알게되는 것도 많겠지만 모든 것을 데이터로 만드는 과정에서 잃어버릴 것들이 있을지도 모른다. 생물다양성과 더불어 '데이터 다양성(data diversi..
2023.11.16 -
연구 방법 4가지
기술연구, 상관연구, 실험연구, 비실험연구 1. 기술 연구: 개별 변수를 단순히 기술함. 2. 상관 연구: 각 개인에 대해 서로 다른 두변수를 측정하고 자료를 표시함. 예) 각 개인에 대해 두 가지 측정(페이스북 사용 시간과 학업 성취도) 자료가 연속 점수로 구성되는 경우 상관관계 통계로 측정 기술 자료가 비연속 점수로 구성되는 경우 카이제곱 검정 통계로 기술 한계- 두 변수 사이의 관계에 대한 설명 제공하지 않음. 3. 실험 연구: 변수 중 하나를 사용하여 집단을 정의한 다음, 두 번째 변수를 측정하여 각 집단에 대한 점수를 통해 변수 간의 관계(인과관계)를 연구함. 예) 한 변수 (폭력적 게임 대 비폭력적 게임-독립변수)으로 집단 정의, 다른 변수(공격행동-종속변수)으로 점수 측정 4. 비실험 연구:..
2023.11.16