분류 전체보기 151

Pandas DataFrame의 데이터 전처리

1. 파생변수 생성 2. 표준화 3. 정규화 dic1={'first':['a','b','c'], 'second':['d','e','f']} df1=pd.DataFrame(dic1) df1 파생변수 생성 새로운 열을 만들어준다. 1. 각 열 원소의 합 df1["str_plus"]=df1['first']+df1['second'] print(df1) >> first second str_plus 0 a d ad 1 b e be 2 c f cf 2. []를 사용 3. insert() 사용 insert(삽일될 열 번호, 열 이름, 삽입될 값, 중복 열 삽입 허용) 중복 열 삽입 허용 기본값은 False https://wikidocs.net/151527 4. assign() 사용 5. loc[] 사용 print(df..

빅데이터 공부 2023.07.12

판다스(Pandas)

print(sr2[[2,3]])#숫자 인덱스에 sr2[2], sr2[3] 출력 print(sr2[['2','3']])#문자열 인덱스에 sr2['2'], sr2['3'] 출력 판다스는 행과 열로 구성된 테이블 형식의 데이터를 다루는 데이터 분석에 많이 사용되는 패키지이다. 변수가 1개일 경우에는 시리즈(Series), 변수가 2개 이상이면 데이터프레임(Data Frame) 객체를 사용한다. 판다스 패키지 추가 import pandas as pd Series: 1차원 배열 형태의 구조로, 인덱스와 데이터가 있어 파이썬 딕셔너리와 유사하다. 배열의 각 원소에는 서로 다른 자료형을 넣을 수 있고, 다차원 배열도 원소로 넣을 수 있다. DataFrame: 2차원 테이블 형태의 구조로, 여러 열과 행을 가지며 열은..

빅데이터 공부 2023.06.17

[정보처리기사] 2장 정리

2023.06.04 - [정보 처리 기사] - [정보처리기사] 1장 정리 [정보처리기사] 1장 정리 현행 시스템 파악 절차 1단계 -시스템 구성 파악 -시스템 기능 파악 -시스템 인터페이스 파악 2단계 -아키텍처 구성 파악 -소프트웨어 구성 파악 3단계 -하드웨어 구성 파악 -네트워크 파악 개발 dogfoot1.tistory.com 자료구조의 분류 1. 선형 구조 -배열 -연속리스트(Contiguous List) -연결리스트(Linked List) -스택 -큐 -테크 2. 비선형 구조 -트리 -그래프 트리(Tree) 트리의 운행법 -Preoreder(전위): 중앙->왼쪽->오른쪽 -Inorder(중위): 왼쪽->중앙->오른쪽 -Postorder(후위): 왼쪽->오른쪽->중앙 수식의 표기법 -Prefix(..

[정보처리기사] 1장 정리

현행 시스템 파악 절차 1단계 -시스템 구성 파악 -시스템 기능 파악 -시스템 인터페이스 파악 2단계 -아키텍처 구성 파악 -소프트웨어 구성 파악 3단계 -하드웨어 구성 파악 -네트워크 파악 개발 기술 환경 파악 -운영체제, 데이터베이스 관리 시스템(DBMS), 미들웨어 요구사항 유형 1. 기술하는 내용에 따라 -기능 요구사항 -비기능 요구사항 2. 기술관점과 대상의 범위에 따라 -사용자 요구사항 -시스템 요구사항 요구사항 개발 프로세스 도출->분석->명세->확인(검토, 검증) 요구사항 명세 기법 -정형 명세 기법 -비정형 명세 기법 요구사항 분석 구조적 분석 기법 -자료 흐름도(DFD) -자료 사전(DD) 자료 흐름도 기본 기호 4가지 -프로세스 -자료 흐름 -자료 저장소 -단말 요구사항 분석 CASE..

넘파이(Numpy)

넘파이: 행렬이나 대규모 다차원 배열을 쉽게 처리하도록 도와주는 파이썬 패키지 리스트와 차이 리스트(List) 넘파이(Numpy) 자료형 다양한 자료형 동일한 자료형 배열의 크기가 커질수록 성능 떨어짐 높은 성능 보장 Numpy 패키지 추가 #numpy 패키지를 np라는 이름으로 사용 import numpy as np ndarray 객체: 넘파이 패키지에 있는 다차원 배열을 지원하는 클래스이다. ndarray 객체 생성 메소드: array(), random.randn(), zeros(), ones(), arange(), reshape() 1. np.array(리스트/튜플) 리스트, 튜플 등을 ndarray 객체로 생성 ar1=np.array([1,2,3,4,5])#1차원 리스트->ndarray 객체 ar..

빅데이터 공부 2023.06.03

Roboflow와 Colab 연동

데이터셋으로 roboflow에서 라벨링을 했다면 colab에 roboflow의 데이터 셋을 넘겨줄 차례이다. 내가 원한 데이터셋을 클릭하고 왼쪽 하단에 Generate를 클릭한다 Preprocessing에서 Modify Classes를 하면 라벨 이름을 바꿀 수 있다. 코랩에서 한글 이름은 깨져서 영어 이름으로 바꿔줬다. 나는 다 continue하고 generate를 해줬다. generate를 하고 난 후 나는 YOLOv5를 사용할 것이기 때문에 YOLOv5 버전을 선택해주고 Get Snippet을 한다. 원하는 코드를 복사해준다. Jupyter와 Terminal 모두 가능했다(Raw URL은 사용해보지 않아서 모르겠음) 코랩으로 돌아와서 colab은 리눅스 기반이기 때문에 리눅스 명령어를 사용한다. m..

딥러닝 공부 2023.06.01

[HackerRank] New Year Chaos

내용 바뀐 대기열을 보고 처음의 대기열과 비교해 최소 바뀐 횟수를 출력. 단 한 사람 당 2번만 바꿀 수 있고, 3번 이상 바꿀 시 Too chaotic을 출력 입력값: t(테스트 횟수), n(롤러코스터 대기자 수), q(바뀐 대기열) 알고리즘 1부터 시작해서 n까지 원래 지점에서 앞으로 몇 번 왔는지 세어 본다(index() 사용). 제자리에 있는 것은 넘어간다 ->Time limit exceeded 참고자료 리스트 삭제 관련 del list /리스트 전체 삭제 del list[인덱스 번호] list.remove(요소) /요소가 없으면 에러 del list[list.index(찾을 요소)] /요소 없으면 에러 list.append(요소), list,insert(인덱스넘버, 요소), list.extend..

[HackerRanck] Grid Challenge

내용 입력된 grid_item을 각각 grid 리스트에 넣어서 각 행을 오름차순으로 정렬. grid의 열을 비교했을 때 오름차순으로 되어 있으면 YES를 리턴, 아니면 NO를 리턴 입력값: t(시험할 테스트 수), n(넣을 행), grid_item(n개의 문자) 알고리즘: grid의 각 행을 오름차순으로 정렬(리스트로 바꿔서 sort() 사용) grid의 열이 오름차순인지 확인. 아니면 NO 리턴, 맞으면 YES 리턴 def gridChallenge(grid): n=len(grid)#행 수 arr=[] for i in range(n): a=[] for j in range (len(grid[0])):#grid의 열 수 만큼 반복 a.append(grid[i][j]) a.sort()#a 오름차순 정렬 arr..