목록전체 글 (22)
Hailey's TIL

1. 가설과 가설 검정 *️⃣ 과학 연구 절차 1) 모집단(Population) : 우리가 알고 싶은 대상 전체 영역(데이터) 2) 표본(Sample) : 그 대상의 일부 영역(데이터) => 모집단을 대표할 수 있는지 알 수 있음! (진짜 알고 싶은 건 모집단) ✔️ 일부분으로 전체를 추정하고자 한다면 모집단에 대한 가설 수립 가설은 보통 x와 y의 관계를 표현 X에 따라 Y가 차이가 있다. X와 Y는 관계가 있다. 표본을 가지고 가설이 진짜 그러한지 검증(검정) 숫자> X와 Y의 관계가 강한지 약한지 알아보기 위해 도구를 이용한다! 1. 시각화: 산점도 상관 분석 상관 분석은 연속형 변수 X에 대한 연속형 변수 Y의 관계를 분석할 때 사용 Scatter를 통해 시각화 가설 : 온도(x)가 상승하면 아이..

1. 데이터의 시각화 2. matplotlib와 seaborn 패키지 : 파이썬의 시각화 패키지 3. 기본 코드 구조 1) matplotlib.pylot matplot.pyplot의 별칭으로 plt 사용 Seaborn의 별칭은 sns 2) plt.plot() 기본 라인차트를 그려준다. 3) plt.show() 그래프를 화면에 출력 4. 기본 코드: x, y값 지정하기 1) x와 y값 지정 1차원 : list, numpy array, series 등을 각각 x와 y로 지정해서 사용 2차원 : dictionary, dataframe로 부터 x와 y를 가져와서 사용 가능 2) 문법 plt.plot(x, y) plt.plot(x, y, data) # 타입1 plt.plot(data['Date'], data['T..

0. 데이터 전처리 1) 데이터 구조 만들기 2) 모델링을 위한 전처리 1. 열 이름 변경 1) columns 속성 변경: 모든 열 이름 변경 tip.columns = ['total_bill', 'tip', 'sex', 'smoker', 'day', 'time', 'size'] 2) rename() 메소드 사용: 지정한 열 이름 변경 tip.rename(columns={'total_bill_amount': 'total_bill', 'male_female': 'sex', 'smoke_yes_no': 'smoker', 'week_name': 'day', 'dinner_lunch': 'time'}, inplace=True) 3) 맨 뒤에 열 추가 -> 맨 뒤에 열을 추가하면 # final_amt 열 추가 ti..

- 문제) 1부터 100까지 홀수만 더해라 total = 0 i =1 while i if문 total +=i # total = total + i i +=1 # 반복 조건 - 함수에는 기본값을 지정할 수도 있고 안할 수도 있음. - print() 는 결과를 화면에 출력 - return은 값을 저장! - CRISP-DM - 무엇이 문제인가? => 첫 질문 문제가 해결되는가? => 마지막 질문 1. 분석할 수 있는 데이터 범주형은 대체로 우리가 결정을 해서 만들어 내는 것이다. 범주형이냐 수치형이냐에 따라서 분석 도구, 모델링 도구, 방법 등이 달라진다. 이러한 데이터는 기본이 2차원이다. => Table, 2차원 Array. Data Frame 1) 열, 정보, 변수, 요인(x, feature), 결과(y,..
▶ 새로 배운 내용 1. Client-Server Model Client-Server Model - 서비스 요청자인 client와 서비스 자원의 제공자인 server 간에 작업을 분리해 주는 분산 애플리케이션 구조이자 네트워크 아키텍처 Client-Server Model 종류 - Web server(Apache or IIS) - Web client(인터넷 익스플로러, 크롬, 사파리, 파이어폭스 등 ) - Telnet server - Telnet client (telnet, PuTTY 등) - SSH server - SSH client (ssh, PuTTY 등) - VNC server - VNC client (vncviewer, TightVNC 등) - FTP server - FTP client (File..

▶ 실습 과제 - 이제까지 해왔던 실습 중 모르거나 복습하고 싶은 실습 2개 진행 1. 우분투 새로 설치하기 강의를 하면서 가장 먼저 배운것이 우분투를 설치하는 것이었고 거의 매 실습마다 우분투 서버를 백업 파일에 저장해 놓았던 것을 다시 설치하여 실습을 진행하였다. 하지만 계속해서 서버를 지우고 설치하고 반복하다 보니 백업 서버를 설치하는 과정에서 아무것도 없는 1주차 상태의 서버를 지워버렸고 백업 폴더에 저장해놓은 서버에 기존에 실습했던 것이 다 담겨져 있어 보기에도 안좋고 원상태로 복구하기도 힘들어서 복습을 하는 김에 새로 우분투를 설치하는 실습을 진행하였다. 우분투를 새로 설치 하기 전에는 cs-1, it등의 전에 실습 과제로 만들었던 계정이 남아있었고 하드 디스크도 여러개로 만들었었는데 다시 새..

▶ 실습 과제 유용한 bash script 작성하기 - 랜덤으로 문자열과 난수를 생성하는 bash script를 작성하였다. - random_test1: A 또는 C 랜덤 출력 - random_test2: 모든 영어 대/소문자와 숫자 중 8자리 랜덤 출력 - random_test3: 0부터 9까지의 랜덤 숫자 생성 - random_test4: 1부터 100까지의 랜덤 숫자 생성 - 유용하다고 생각한 이유 : 일상생활에서 랜덤으로 문자나 숫자를 뽑아야하는 경우가 많은데 이 때 사용할 수 있다고 생각되어 작성해보았다. 예를 들어 test2는 패스워드를 만들거나 어떤 항목에 무작위로 식별가능한 코드를 부여할때 사용될 수 있고, test4 같은 경우에는 제비뽑기나 순서를 결정할때 사용하는데 적합하다. (*참고한..
01. 삼각형을 나타내는 Triangle 클래스를 작성하라. 삼각형의 속성으로는 실수값의 밑변과 높이를, 동작으로는 넓이 구하기와 접근자가 있고 생성자도 포함한다. 작성한 클래스를 다음 코드를사용해 테스트하라. public class chap0401 { public static void main(String[] args) { Triangle t = new Triangle(10.0, 5.0); System.out.println(t.findArea()); } } class Triangle { private double baseline; private double height; public Triangle(double baseline, double height) { this.baseline = baseline..