[과제10]

아래와 같은 데이터들을 하나의 DataFrame으로 만들고(index는 labels 사용),

import pandas as pd
import numpy as np
exam_data = {'이름': ['정수현', '윤웅익', '우성호', '김복희', '홍길동', '임꺽정', '이창신', '김완', '최영규', '한범석'],
'점수': [12.5, 9, 16.5, np.nan, 9, 20, 14.5, np.nan, 8, 19],
'응시횟수': [1, 3, 2, 3, 2, 3, 1, 1, 2, 1],
'합격여부': ['yes', 'no', 'yes', 'no', 'no', 'yes', 'yes', 'no', 'no', 'yes']}
labels=list( 'abcdefghij' )
df = pd.DataFrame(exam_data, index=labels)

‘점수’ 에Missing data인 NaN값을 평균값(mean) 값으로 변경하는 코드를 작성하시오.

df.fillna(value=df.mean())

합격 여부가 yes인 사람과 no인 사람의 수를 출력하시오. 단 groupby()를 사용해 코드를 작성하시 오.

df.groupby('합격여부').count()

난수를 사용해서 서로 크기와 색깔의 값 25개의 산포도를 그리시오.

• 단, 색깔의 종류는 4가지로 하고, 점의 크기는 적절한 범위내에서 선택되도록 하시오. x, y 좌표는 0과 1 사이이다.

data = {'a': np.random.rand(25),
       'c': np.random.randint(0, 25, 25),
       'd':np.random.rand(25)}
data['b'] = data['a']*np.random.rand(25)
data['d'] = np.abs(data['d'])*300

plt.scatter('a','b', c='c', s='d', data=data)
plt.xlabel('x')
plt.ylabel('y')
plt.show()

'과제' 카테고리의 다른 글

컴사파 - 2주차 (1)	2022.09.17
컴사파 - 1주차 (0)	2022.09.16
[과제9] 평균, 분산 및 표준편차 (0)	2022.05.18
[과제6] (0)	2022.05.18
[과제5] 냉장고에 음식 넣었다 빼기, 로또 걸리게 해주세요 (2)	2022.04.14

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

[과제10]

'과제' 카테고리의 다른 글

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역