Sector별로 다른 action

Energy utility가 타 분야와 다르다고 함

플젝설명

DataGenerator.py

  • merge_DataFrame(index = dates)
  • make_features(start_date, end_date, is_training) – return: s_open, s_close, features

simulation.py

run_simulation함수 내에서 do_action함수 호출해

budget, num_stocks, action 리턴

 

decision_ql.py

class QLearningDecisionPolicy

def init(self, actions, input_dim, model_dir) : return None

def select_action(self, current_state, is_training) : return action

def update_q(self, current_state, action, reward, next_state) : return None, 대신 마지막줄에 self.sess.run(self.train_op, feed_dict={self.x: current_state, self.y: action_q_vals}) 를 통해 뭔가 모형학습시키는듯

def save_model(self, output_dir, step):

 

RL_Training.py

open_prices, close_prices, features를 make_features함수에서 가져오고

action, policy, budget, num_stocks, num_epoch을 정의한 후

run_simulation함

 

actions를 ***로 정의함

 

RL_Test.py

def test(policy, initial_budget, initial_num_stocks, open_prices, close_prices, features) : return portfolio

open_prices의 길이(=주식종류수일듯)만큼 loop 돌고,

current_state를 feature, budget, num_stocks로 update

action을 policy에 따라 여러 action중 current_state에 의거해 서냍ㄱ

i번째 주식종류는 stock_price는 시가 중 i번째

포트폴리오 = budget + num_stocks * close_prices[-1]

해당 포트폴리오를 리턴

 

 

모의투자

사고 파는걸 액션 높을때 사서 낮을때 판다는 액션

특정 피쳐 만들고 스테이트 액션 리워드 정의!

액션을 산의 십승으로 정의도 가능액션을 산의 십승으로 정의도 가능

tensorflow설명

Session 만들어줘야 실행

자료형 byte라 b 찍힘

Sessmrun().decode로 스트링타입변환

그래프 그리고 실행(흘려줌)

Const exec

구성.실행 단계

초기화

F close 안해도 되듯이

With tf.sessions

피클 아닌 체크포인트 확장자 이용

불러올땐 변수초기화 무필요

그냥 프린트 안되고 sess.run해줘야 찍힘

Mnist.train.batch시 자동 다음 배치 생성

한 배치에 대한 소프트맥스 크로스엔트로피

총 600개 배치

Logit output

Softmax apply ->

Tf.nnsoftmax

모의투자

사고 파는걸 액션 높을때 사서 낮을때 판다는 액션

특정 피쳐 만들고 스테이트 액션 리워드 정의!

시장에 영향 안 미침

개장시간에 시가로 주식거래 가정

오픈프라이스로 사서 열흘동안

주식이 없는데 파는 공매도

사고파는건 오픈가격 다편가는 클로즈거격

712345

20일까지 테스트데이터

가만히 있어도 됨

마지막닐 종가

폴더하나 생상 ckpt저장

전체 흐름 볼 수 있는 코스피가 필요하지 않을까?

전자는 다 박살

매도는 시가, 일자별

Decision qql network

애션은 시뮬레이셔 피와이

데이터제에서 데이터 처리

앞 날들의 종가를 피쳐 삼일치사거나 팔거나 가만히 액션

액션을 산의 십승으로 정의도 가능

쌍으로 묶어서 사고 팔수도

순차적으로 할수도

13 왜 +2?

수중돈 주식 개수

지금 주식 개수와 현자 자산이라

큐벨류 최대 선택 여러가지 탐색 못하니까 익스플로레이션랜덤앗성 확률

디시젼 큐엘 파이

Q 확률값 y 는

Select action

감마 강의에선 이타로

68줄

0은 그냥 앞에 하나추아

업데으트

시뮬레이션

여러번 해보겠다

론 기뮬레이션

Marketdata.krx.co.kr

시장전보 종목정보 일자별시세

셀크리온 하나가 없고 두개가 더 들어감

야후에 없고 한국사이트에 없는 날짜

2015-08-14

2017-09-22, 2017-12-20

셀트리온엔 있는데 나머지 두개엔 없다

야후에 샐트리온 이상

한국에서 두 개 날따이 해당하는 아홉가 회사