강화학습 이론&실습

황현석 저자(글)

비제이퍼블릭 · 2023년 10월 04일

7.5 (1개의 리뷰)

도움돼요 (100%의 구매자)

A4

사이즈 비교

210x297

강화학습 이론&실습 사이즈 비교 188x245

단위 : mm

무료배송 소득공제

10% 27,000원 ~~30,000원~~

적립/혜택

1,500P

배송안내

무료배송

주문정보를 불러오는 중입니다.

기본배송지 기준

로그인 후 정확한 배송 안내를 받아보세요!

이벤트
상품정보
리뷰 (1)
교환/반품/품절

해외주문/바로드림/제휴사주문/업체배송건의 경우 1+1 증정상품이 발송되지 않습니다.

패키지

북카드

함께 구매한 책

키워드 Pick

책 소개

이 책이 속한 분야

*충실한 이론 배경과 간결한 파이썬 코드를 활용하여 어렵게만 느껴지는 인공지능 강화학습 알고리즘을 내 도구로 만드는 길잡이.*

ChatGPT로 다시금 떠오른 화두인 인공지능 알고리즘 중 강화학습을 배우는 데 초점을 둔 책입니다. 인공지능은 논문과 전공책으로 무작정 공부하기에 다양한 배경 지식이 요구되어 도전하기 어려운 분야입니다. 본 책은 강화학습을 배우기 위해 필요한 사전 지식들을 최대한 쉽고 자세하게 정리하여 초심자들이 느끼는 진입 장벽을 최대한 낮춤과 동시에, 다양한 예제와 기본이 되는 알고리즘을 상세하게 설명하여 책을 읽고 난 뒤 강화학습을 연구하는 데 도움이 될 수 있도록 하였습니다. 또한 예제들을 실제로 해결해보면 인공지능이 스스로 사람이 설정한 목표로 문제를 해결하는 동영상들을 확인할 수 있으므로 독자 여러분은 살아있는 공부를 경험하게 되어 어렵게만 느껴졌던 이론을 재미있게 학습하실수 있을 것입니다.

전체선택

작가정보

저자(글) 황현석

인물정보

IT종사자

부산대학교에서 자연과학을 공부하고 서울대학교에서 계산과학 분야로 전공을 바꾸어 공학석사 학위를 취득했다. 공식 교과과정에서 편미분 방정식을 푸는 방식을 배울 때 대학원 시절 동안 옆자리에 앉았던 동기가 인공지능을 공부하는 것을 보고 따라서 머신러닝을 조금씩 독학하기 시작했다. 머신러닝 분야 중 게임을 스스로 플레이 하는 인공지능을 보고 강화학습에 가장 큰 흥미를 느낀 뒤 취미 삼아 이론을 공부하고 개념을 구현하는 데 시간을 많이 보냈다. 어쩌다 보니 현재 인공지능 알고리즘을 적용하는 반도체 모델링을 타겟으로 하는 회사에서 인공지능을 전자회로 시뮬레이터에 접목하는 업무를 맡고 있다.

프롤로그
1. 환경 설정

1.1 윈도우 버전

1.2 리눅스 버전

2. 강화 학습을 위한 사전 지식

2.1 머신 러닝과 강화 학습
2.1.1 머신 러닝
2.1.2 강화 학습

2.2 기초 수학
2.2.1 기초 선형 대수
2.2.2 기초 미분과 적분
2.2.3 기초 확률 통계

2.3 최적화
2.3.1 뉴턴-랩슨법(Newton-Raphson method)
2.3.2 경사 하강법(Gradient descent method)

2.4 목적 함수
2.4.1 최소 제곱
2.4.2 확률 엔트로피와 쿨백-라이블러 발산

2.5 인공 신경망
2.5.1 신호 전·후 처리
2.5.2 순방향 전파
2.5.3 역방향 전파

2.6 초간단 파이토치 튜토리얼
2.6.1 MNIST
2.6.2 회귀 분석

2.7 매개 변수 탐색법
2.7.1 격자 탐색법(Grid search)
2.7.2 베이지안 탐색법(Bayesian optimization)

3. 마르코프 의사 결정과 동적 계획법 풀이 전략

3.1 마르코프 의사 결정

3.2 동적 계획법

3.3 [실습] 잭의 렌터카 업체 운영 전략 - 동적 계획법을 이용한 마르코프 의사 결정

4. 밸만 방정식부터 강화 학습까지

4.1 몬테-카를로 추정법

4.2 시간차 학습
4.2.1 TD(0)
4.2.2 TD(λ)

4.3 Monte-Carlo vs Temporal Difference

4.4 에이전트 학습
4.4.1 SARSA
4.4.2 Q-learning
4.4.3 실습

5. Q-함수는 신경망에 맡긴다 - DQN

5.1 DQN 208
5.1.1 이론 209
5.1.2 실습 219
5.2 파생 알고리즘 256
5.2.1 DDQN 256
5.2.2 PER 260

6. 즉각적인 학습이 필요할 때 - Policy gradient

6.1 Actor-Critic
6.1.1 이론
6.1.2 실습

6.2 파생 알고리즘
6.2.1 Asynchronous Advantage Actor-Critic
6.2.2 LSTM-Based Advantage Actor-Critic
6.2.3 [고급] Trust Region Policy Optimization
6.2.4 [고급] Proximal Policy Optimization

7. 탐험의 전략 - Model based learning

7.1 사전 지식 - 밴딧 모델

7.2 이론 - Monte-Carlo Tree Search

7.3 실습
7.3.1 CartPole
7.3.2 Tic-Tac-Toe

찾아보기

출판사 서평

“데이터 분석에 의존한 머신러닝은 이제 그만!”

『강화학습 이론&실습』이 책은 아직도 인공지능이 적용되지 못 한 산업에서 기술을 적용할 가능성을 제안하는 도서이다. 이 책이면 인간보다 주어진 환경에 더 잘 적응하는 인공지능의 개념을 공부하여 나만의 인공지능을 만드는 기술에 대해서 배울 수 있다.

기본정보

상품정보
ISBN	9791165922450
발행(출시)일자	2023년 10월 04일
쪽수	392쪽
크기	188 * 245 * 27 mm / 901 g
총권수	1권

Klover

구매 후 리뷰 작성 시, e교환권 200원 적립

문장수집

구매 후 리뷰 작성 시, e교환권 100원 적립

이 책의 첫 기록을 남겨주세요

교환/반품/품절 안내

반품/교환 신청 1:1 문의

상품 설명에 반품/교환 관련한 안내가 있는 경우 그 내용을 우선으로 합니다. (업체 사정에 따라 달라질 수 있습니다.)

총 상품 금액 27,000 원

선물하기

바로드림 바로구매

배송 일정 안내 테이블로 결제 완료 시간, 도착예정일 결제 완료 시간 컬럼의 하위로 평일 0시 ~ 12시 토요일 0시 ~ 11시 평일 12시 ~ 22시 평일 12시 ~ 24시 토요일 11시 ~ 21시 을(를) 나타낸 표입니다.

결제 완료 시간

도착예정일

평일 0시 ~ 12시

토요일 0시 ~ 11시

당일배송 오늘

당일배송 오늘

평일 12시 ~ 22시

평일 12시 ~ 24시

토요일 11시 ~ 21시

새벽배송 내일 07시 이전

내일

일요배송 일요일

배송 일정 안내 테이블로 결제 완료 시간, 도착예정일 결제 완료 시간 컬럼의 하위로 월~토 0시 ~ 11시 30분 을(를) 나타낸 표입니다.

결제 완료 시간

도착예정일

월~토 0시 ~ 11시 30분

당일배송 오늘

강화학습 이론&실습

패키지

북카드

함께 구매한 책

키워드 Pick

책 소개

작가정보

저자(글) 황현석

목차

추천사

출판사 서평

기본정보

교환/반품/품절 안내

수도권 외 (천안, 대전, 울산, 부산, 대구, 창원)

배송 유의사항

바로드림존에서 받기

이용 안내

수령 안내

취소/교환/반품 안내

사은품 관련 안내

음반/DVD 바로드림시 유의사항

해외주문양서 배송지연 안내