My Profile Photo

DongChanS's blog


수학과 학생의 개발일지


프로젝트 정리) 회계데이터 분석(2)

1편에 이어서 본격적으로 데이터분석을 해보겠습니다.

[풀어야할 문제]

“여성 사외 이사의 존재성은 ROA와 RET1Y의 CEO compensation에 대한 반영(민감도)에 유의미한 영향을 미치는가?”

결론적으로 문제에 맞춰서 회귀분석 모델을 만들어야 하는데,

우리가 가진 모든 feature들을 전부 선형회귀 모델에 넣으면 참 좋겠지만,

종속변수와 관계가 없는 feature들을 선형회귀모델에 투입한다면 추정값의 분산이 높아지기 때문에 신뢰도가 떨어질 수 밖에 없다.

이를 다중공선성(colinearity)라고 한다.

3

의미없는 변수 제거

- GVKEY : 이 gvkey에서 회사의 범주를 묶을 수 있는 특별한 패턴을 찾기 힘들어서 제거하였다

- COMPNAME : 회사의 이름 자체는 CEO의 임금에 상관이 없으므로 제거하였다

- CEOAGE : 일반적으로 CEO의 나이가 높을수록 CEO의 근속년수도 높은 경향을 보일 수는 있으나, CEO의 근속년수라는 변수가 있기 때문에 굳이 넣지 않았다.

- CEOGENDER : 이 데이터의 값이 1인 비율은 채 3%가 되지 않으며, CEO의 성별은 실험목적과는 관계가 없으므로 제거하였다.

library(tidyverse)
train = read.csv('Q1_FEMALE_DIRECTOR.csv')

# data removing
train[c('GVKEY','COMPNAME','CEOGENDER','CEOAGE')] = NULL

- BOARDSIZE : 직접적으로 회귀모델에 이 변수를 넣지는 않았다. 하지만, 데이터를 이사회 규모가 큰 데이터와 작은 데이터로 분리하여 따로 회귀분석을 적용하였다.

이사회에 많은 이사가 존재할 수록 여성 사외이사가 존재할 확률이 높아지는 것은 당연하다. 그렇기 때문에 이사회의 규모가 큰 회사와 작은 회사를 분리하지 않으면 우리의 실험이 “여성 사외이사가 존재하기 때문에 CEO의 임금에 대한 성과보상 민감도가 커진다”가 아니라 “이사회의 규모가 크기 때문에 (여성 사외이사가 존재하고) 그렇기 때문에 CEO의 임금에 대한 성과보상 민감도가 커진다” 라는 잘못된 결론이 나오게 될 수 있다.

또한, 이사회의 규모는 회사의 규모에 큰 영향을 받으며 만약, 그 두 변수를 동시에 넣는다면 다중공선성 문제가 발생할 수 있을 것이라 생각할 수 있다.

# BOARDSIZE에 대해서 FEMALEID의 효과가 다르지 않을까?
train_bu = train %>% filter(train$BOARDSIZE >= 10)
train_bl = train %>% filter(train$BOARDSIZE < 10 )

추가한 독립변수

- SIC2D : 회사의 직종에 따라서 같은 시기에도 호황과 불황이 다를 수 있으며, 그렇기 때문에 CEO의 임금에도 영향을 미칠 수 있을 것이라 생각하였다. 다만, 값이 numeric으로서의 역할을 하지 않기 때문에 1,2 digit를 따로 dummy variable(train_1_n, train_2_m)들로 만들어서 사용하였다. 그리고 perfect collinearity 문제를 해결하기 위하여 가장 해당하는 인원수가 적은 train_1_1과 train_2_0을 삭제하여 모델에 넣었다.

# quotient and remainder
train['SIC2DIG'] <- train['SIC2D'] %/% 10
train['SIC1DIG'] <- train['SIC2D'] %% 10

# factorization
train$SIC2DIG <- as.factor(train$SIC2DIG)
train$SIC1DIG <- as.factor(train$SIC1DIG)

# factor to dummy variable
# install.packages('dummies')
library(dummies)
train <- cbind(train, dummy(train$SIC2DIG,sep = "_2_"))
train <- cbind(train, dummy(train$SIC1DIG,sep = "_1_"))

- DUALITY : CEO와 이사회 의장을 분리해서 운영하게 된다면 이사회가 본래의 기능인 CEO에 대한 통제,감시,감독을 다할 수 있어 회사가 투자자로부터 높은 신뢰를 받음으로써 회사의 재정에 긍정적인 영향을 줄 수 있고, 반대로 CEO와 의장이 일치하다면 그만큼 CEO의 권력이 높다는 것을 반증하므로 두 가지의 요소가 CEO의 임금에 복합적으로 반영이 될 것이라 보여진다.

- CEOTEUNRE : 이 변수도 DUALITY와 마찬가지로 CEO의 권력과 임금에 영향을 끼칠 수 있을 것이다.

- IDPC : 반대로 이 값이 높다면 회사의 직접적인 통제를 받지 않는 이사의 비율이 높다는 것이며, 이는 DUALITY가 0인 것과 비슷한 장점을 가질 것이다.

- SIZE : 회사의 총 자산이 클수록 CEO에 더 많은 임금을 줄것이라고 자연스럽게 추론할 수 있다.

- SALESGROWTH : 회사가 성장세를 보일수록 CEO가 연봉협상에 유리한 고지를 점할 것이다.

- FCF, MKTLEV : 직접적으로 CEO의 성과에 어떤 영향을 미치는지는 알 수 없지만, 회사의 자금 흐름과 안정성을 대변해주는 재무변수이기 때문에 변수에 추가하였다.

- BUSYBOARD : 회사의 주요한 사외이사가 여러 이사회에 참석할 수록, 주요 이사들이 회사 각각의 통치구조(corporate governance)에 기여하는 정도는 덜 할 것이다. 따라서 ceo에 대한 감시가 덜할 것이라 추론할 수 있다.

- BM : 이것은 회사가 고평가를 받는지 아닌지를 나타내는 변수로써, 만약 그 회사가 고평가를 받는다면 그 회사의 자산에 비하여 ceo에게 많은 돈을 지불해야 할 것 이다.

추가적인 모델링

  1. 선형성을 확보하기 위해서 log transformation
# data transformation
train['LOGCOMP'] = log(train['REALCEOCOMP'])
  1. interaction term

“여성 사외 이사의 존재성(FEMALEID == 1)은 ROA와 RET1Y의 CEO compensation에 대한 반영(민감도)에 유의미한 영향을 미치는가?”

에 대해서 판단하는 것이 목적이기 때문에 우리는 독립변수간의 joint effect에 초점을 맞춰야한다.

따라서, FEMALEID와 ROA, RET1Y에 대해 interaction term을 추가하였다.

# interaction term
train['FEMALE_RET1Y'] <- train$FEMALEID * train$RET1Y
train['FEMALE_ROA'] <- train$FEMALEID * train$ROA

전반적인 선형모델과 가설

4

선형회귀모델의 가설검정

result_bu <- lm(formula = LOGCOMP ~ .-CEOAGE-BOARDSIZE-train_2_8, data = train_bu)
result_bl <- lm(formula = LOGCOMP ~ .-CEOAGE-BOARDSIZE-train_2_8, data = train_bl) 

linearHypothesis(result_bl,c("FEMALEID = 0","FEMALE_RET1Y = 0","FEMALE_ROA = 0"),test="F")
linearHypothesis(result_bu,c("FEMALEID = 0","FEMALE_RET1Y = 0","FEMALE_ROA = 0"),test="F")

5

6

데이터 1 : p-value = 0.062 > 0.05 / 데이터2 : p-value = 0.015 < 0.05

따라서 이사회의 규모가 큰 데이터(Data2)에 대하여, 여성 사외이사의 존재성은 ceo 임금과 성과 보상 민감도에 대한 관계에 유의미한 영향을 끼친다고 할 수 있다.

선형회귀모델의 등분산성 검정

데이터2에 대해서 등분산성 검정을 실시하였다.

7

이사회의 이사가 많은 기업(train_bu)에 대한 회귀추정치는 BP TEST의 귀무가설을 기각하는데 성공하였다.

따라서, 주어진 회귀추정치는 등분산성을 만족한다고 할 수 있으며 주어진 least square estimator를heteroskedasticity robust standarized error로 대체하지 않아도 된다.

데이터 2에 대한 결론

선형회귀모델의 계수들이 c_1 = -0.338, c_7 = 0.764, c_8 = 0.592 이므로

  1. 여성 사외이사가 존재하는 기업이 여성 사외이사가 존재하지 않을 때 보다 평균적으로 ceo 연봉을 0.45배정도만 받는다 ( log(-0.338) = 0.45)
  2. 하지만, 여성 사외이사가 존재하는 기업에 대해서는 ROA가 1만큼 증가하면 ceo 연봉을 3.9배정도 획득하는 경향을 보이며, RET1Y가 1만큼 증가하면 무려 5.8배나 더 받게된다.

Reference

원구환(2008) 지방공기업 내부지배구조로서의 이사회 구성과 재무성과간의 상관성 분석, 지방정부연구, 11(4) 111-124

한국상장회사협의회 – 이사회의 특성이 기업가치에 미치는 영향

차운아, 정태훈 규제연구 제23권 제1호, 2014.04, 131-163 이사회 다양성과 기업성과

comments powered by Disqus