[IT] 공부하는 개발자/Data - ALL
-
[R 회귀분석 예제] 야구선수 연봉에 영향을 미치는 요인 (Linear Regression)[IT] 공부하는 개발자/Data - ALL 2020. 6. 21. 11:19
목표 어떤 요소가 야구선수의 연봉에 영향을 미칠까 ? 목차 1. 데이터 분석 2. 데이터 클리닝 3. 변수 선택 3.1 Approaches 3.2 The Best Subset Approach 3.3 Stepwise Approach 과정 1. 데이터 분석 install.packages("ISLR") library(ISLR) dim(Hitters) head(Hitters) summary(Hitters) 야구선수들의 스펙정보와 연봉정보를 제공하는 통계 패키지 ISLR을 이용합니다. 패키지를 설치 후, 임포트해줍니다. 총 263개의 샘플에 20개의 예측 변수를 가진 데이터입니다. 샘플 몇 개를 볼까요. 결과에 영향을 미칠것이라고 가정하고 있는 예측 변수(Predictor Variables)들을 먼저 보면, Le..
-
[Kafka] 카프카란? 개념과 디자인[IT] 공부하는 개발자/Data - ALL 2020. 4. 11. 11:16
차례카프카란카프카의 특징카프카 데이터 모델카프카 리플리케이션 카프카란카프카는 서비스간에 메시지 통신을 제공하는, 메시지 큐 서비스이다. 실 서비스에서 언제 메시지 통신이 요구될까? 하나의 프로젝트로 기능하던 것을 여러개의 프로젝트로 쪼개서 배치되어있는 상황을 생각해보자. 이 때 각각의 도메인들은 내부에서 동적으로 요청을 처리한 후 다른 도메인에 그 결과를 전달해주어야 할 상황들이 있을 것이다. 즉 카프카와 같은 메시지 큐는 마이크로 서비스 아키텍쳐(MSA)를 구현하는 아키텍쳐 및 대량 데이터를 처리하는 분산시스템과 잘 어울린다. 카프카의 특징디스크에 메시지 저장카프카가 기존의 메시징 시스템들과의 다른 특징 중 하나는 디스크에 메시지를 저장하고 유지한다는 것이다. 카프카는 정해져 있는 보관 주기 동안 디..
-
[쉽게 설명하는 머신러닝] 머신러닝 문제 정의, 알고리즘 선택 방법[IT] 공부하는 개발자/Data - ALL 2019. 5. 26. 16:39
이전 포스팅 2019/05/25 - [[IT] 공부하는 개발자/Machine Learning] - [쉽게 설명하는 머신러닝] 개념 정리 [쉽게 설명하는 머신러닝] 개념 정리 머신러닝 개념정리 1. 기계학습이란 2. 인간의 경험학습 3. 기계의 경험 학습 4. 학습시 고려할 것 4.1 데이터 4.2 알고리즘 1. 기계학습이란? 머신러닝이란, 말 그대로 기계를 학습시켜(Machine Lear gem1n1.tistory.com 이전 포스팅에서 예측력이 좋은 모델을 개발하기 위해서는 데이터만큼이나 알고리즘의 선택이 중요하다고 이야기했었다. 이번 포스팅에서는 머신러닝 문제를 정의하고, 그에 따라 알고리즘을 선택하는 방법에 대해 알아볼 것이다. 목차 1. 머신러닝 문제 정의 1.1 지도학습 1.2 비지도학습 1.3..
-
[쉽게 설명하는 머신러닝] 개념 정리[IT] 공부하는 개발자/Data - ALL 2019. 5. 25. 20:57
머신러닝 개념정리 1. 기계학습이란 2. 인간의 경험학습 3. 기계의 경험 학습 4. 학습시 고려할 것 4.1 데이터 4.2 알고리즘 1. 기계학습이란? 머신러닝이란, 말 그대로 기계를 학습시켜(Machine Learning), 의사결정을 할 수 있게 하는 것이다(Decision Making). 기계의 학습에 대해 논하기 전에, 먼저 인간의 학습에 대해 생각해보자. 2. 인간의 경험학습 지금부터 당신의 '강아지vs고양이 분별 모델'의 성능을 체크해 볼것이다. Q1. 아래에 동물 사진 3장이 있다. 강아지는 몇 마리, 고양이는 몇 마리인가? 정답은 강아지 2마리, 고양이 1마리이다. 순서대로 강아지, 고양이, 강아지다. 당신은 아마 100% 정답을 맞췄을 것이다. 그런데, 당신은 어떻게 1번이 강아지이고,..