-
타인의 Github에서 저희가 필요한 기능을 수행하는 AI 모델을 찾았는데 이 모델의 거의 그대로 사용하면 Reference를 어떻게 나타내야 하는가?
- Reference 표시보다 코드 베이스의 라이선스를 먼저 확인해야 한다
높은 확률로 라이선스 작성이 안되어있는데 상용 가능 라이선스로 작성된 코드같은게 있으면 좋긴한데 퍼블리싱 안할꺼니까 그런 차원에서는 그렇게까지 민감한 부분을 하지 않아도 괜찮다.
- 일반적인 즉 현업에서?
서드파티 라이브러리 or 모델의 라이선스 확인
수익화 모델만 없으면 된다
free인데 책임은 못진다… 등등 다양한 케이스 존재
- 대표적인 라이선스 확인 및 공부하면 좋을 것
- Readme에 직접 작성하는 경우는 거의 없다
- public 레포에 올리는 케이스는 드물긴하다
-
CNN을 이용해 이미지들을 분류하려고 하는데 정확도를 높이기 위한 변수들을 튜닝하고 싶은데 이에 필요한 적절한 레퍼런스를 찾는 방법?
- https://github.com/bentrevett/pytorch-image-classification
- 의미가 중요하다
- 레퍼런스 찾을 때 튜토리얼, 키워드 위주로 찾아보는게 효과적일 것이다.
- 하이퍼 파라미터 → 사람마다 다 다르기 때문에 너무 그 사람들 파라미터에 값에 집중하기 보다 파라미터의 의미에 대한 생각, 판단을 하는것이 맞다.
-
데이터에 기반해서 정보를 추출하고 있는데 저희 데이터 양은 빅데이터라고 하기 힘든데 이걸 빅데이터라고 할 수 있는가?
빅데이터 분석이랑 일반적인 데이터 분석이라 어떤 부분에서 결과가 차이가 나는지 모르겠다.
- 데이터가 지금처럼 많지 않던 시절에서 지금은 너무많은 데이터가 존재
이 기간을 나누고자 만들어낸 말 즉 데이터가 많은게 빅데이터다? 그건 아닌듯
- 빅데이터 기반의 기술을 하고 있기 때문에 지금 하고 있는거 자체가 빅데이터의 영역에 있다
- 이게 정답이 없는 문제이지만 원하는 결과를 얻기 위해서는 더욱 많은 데이터가 필요하고 가공하는 것은 당연한 것 물론 잘 정제된 데이터로도 학습하고 결과를 낼 수 있긴 하다. 즉 두 가지는 추구하는 바가 조금 다를 수 있다.