Joonas' Note
Links for Machine Learning 본문
http://www.cs.toronto.edu/~rgrosse/courses/csc321_2017/slides/lec4.pdf
: activation을 다른 곳은 거의 베르누이 썼는데 여긴 softmax를 사용한 강의 자료
https://eli.thegreenplace.net/2016/the-softmax-function-and-its-derivative/
: softmax 미분한 글
https://math.stackexchange.com/questions/477207/derivative-of-cost-function-for-logistic-regression
: chain rule 이해 안될때 보면 되는 글
대수적(?)으로 표현한거지만 예제도 좋고 전개도 잘해서 이해하긴 쉬움
http://sanghyukchun.github.io/42/
: Chain Rule도 잘 적혀있고 (정확히는 backpropagation algorithm 이야기인데..)
다른 Lecture 정리글을 읽으면 갈피를 잡는 데에 많이 도움이 된다.
https://stats.stackexchange.com/questions/235528/backpropagation-with-softmax-cross-entropy
: loss function을 NLL(Negative Log-Likelihood)로 써서 만든 cross-entropy를 편미분하는 과정인데
chain rule에서 각 편미분 값에 대해서 잘 설명되어있다.
https://math.stackexchange.com/a/945918
: 중간에 수식 못 구하는거 하나 있는데, 그거 딱 구하게 해줌. (식 적당히 묶고 log 잘 씌우니까 나와서 신기함)
https://ko.wikipedia.org/wiki/크로네커_델타#크로네커_델타의_성질
: 여기엔 크로네커 델타 함수의 미분값에 대한 성질이 나와있음. (영문 자료는 적분으로 미분을 적어서 알아보기 힘듦)
대신 한국어 위키는 저거밖에 볼 거 없고, 영문 위키를 보는게 정보가 더 많아서 훨씬 나음
https://machinelearningmastery.com/machine-learning-in-python-step-by-step/
: SciPy, NumPy 등 requirements부터 파이썬 코드, 데이터셋까지 뭐가 많다.
링크도 많고 코드도 많아서 볼 내용이 많다. 차근차근 따라하기엔 진짜 좋음
같은 내용인지는 모르겠지만 사이트에서 판매하는 책도 있는 모양이다.
'AI > 수학' 카테고리의 다른 글
행렬식(determinant) 알아보기 + 구현 (0) | 2023.02.01 |
---|