Commit 7cb92e6c authored by Michael Nauge's avatar Michael Nauge
Browse files

Create quantiAnalyse.ipynb

script pour des mesures quantitatives
parent c076fcf9
%% Cell type:code id: tags:
``` python
import pandas as pd
```
%% Cell type:code id: tags:
``` python
pathData = "./../datas/classified_amalgames.xlsx"
df = pd.read_excel(pathData)
df
```
%% Output
Amalgame (graphie) Amalgame (phonie) Mot 1 \
0 acquihire [ˌækwɪˈhaɪ‿ə] [ˌækwɪˈzɪʃən]
1 ASCIIbetical [ˌæskiˈbetɪkəl] [ˈæski]
2 automagically / automagicly [ˌɔːtəʊˈmædʒɪkli] [ˌɔːtəˈmӕtɪkli]
3 avatard [ˈævətɑːd] [ˈævətɑː]
4 babelicious [ˌbeɪbəˈlɪʃəs] [beɪb]
.. ... ... ...
97 webinar [ˈwebɪnɑː] [web]
98 webstagram [ˈwebstəgræm] [web]
99 whack [wæk] [ˈwaɪ‿ələs]
100 wigger / whigger [ˈwɪɡə] [waɪt]
101 Winblows [ˈwɪnbləʊz] [ˈwɪndəʊz]
Mot 2 mot1clean mot2clean Amalgameclean \
0 [ˈhaɪ‿ə] ækwɪzɪʃən haɪə ækwɪhaɪə
1 [ˌӕlfəˈbetɪkəl] æski ælfəbetɪkəl æskibetɪkəl
2 [ˈmӕdʒɪkli] ɔtəmætɪkli mædʒɪkli ɔtəʊmædʒɪkli
3 [ˈtɑːd] ævətɑ tɑd ævətɑd
4 [diˈlɪʃəs] / [dəˈlɪʃəs] beɪb dilɪʃəs beɪbəlɪʃəs
.. ... ... ... ...
97 [ˈsemɪnɑː] web semɪnɑ webɪnɑ
98 [ˈɪnstəgræm] web ɪnstəgræm webstəgræm
99 [hæk] waɪələs hæk wæk
100 [ˈnɪɡə] waɪt nɪɡə wɪɡə
101 [bləʊ] wɪndəʊz bləʊ wɪnbləʊz
solvedBy findedOverlap deletedSegmentMot1 \
0 isSolveByClip1Concat NaN zɪʃən
1 isSolveByClip2Concat NaN NaN
2 NaN NaN NaN
3 isSolveByOverlap tɑ NaN
4 NaN NaN NaN
.. ... ... ...
97 isSolveByClip2Concat NaN NaN
98 isSolveByClip2Concat NaN NaN
99 isSolveByClip1Clip2Concat NaN aɪələs
100 isSolveByClip1Clip2Concat NaN aɪt
101 NaN NaN NaN
deletedSegmentMot2
0 NaN
1 ælfə
2 NaN
3 NaN
4 NaN
.. ...
97 sem
98 ɪn
99 h
100 n
101 NaN
[102 rows x 11 columns]
%% Cell type:code id: tags:
``` python
df['findedOverlap'].value_counts()
```
%% Output
ɪn 3
əʊ 3
æk 3
rəʊ 3
t 3
æ 2
p 2
æp 1
eɪk 1
lɒ 1
tɑ 1
en 1
et 1
in 1
l 1
æn 1
s 1
ʌ 1
eə 1
eɪt 1
əlɒs 1
i 1
e 1
eks 1
ip 1
z 1
f 1
Name: findedOverlap, dtype: int64
%% Cell type:code id: tags:
``` python
df['deletedSegmentMot1'].value_counts()
```
%% Output
d 2
eɪk 2
rət 1
ɪŋ 1
kɪŋ 1
græm 1
rikɪŋ 1
eɪdʒə 1
əfə 1
stfid 1
ud 1
aɪələs 1
v 1
zɪʃən 1
əʊtəʊ 1
keɪʃən 1
g 1
ɪtəl 1
əʊk 1
t 1
ɒg 1
ɪtə 1
əʊn 1
ɒnəbi 1
bʊk 1
ʌm 1
aɪt 1
ʌt 1
aɪəl 1
ɔɪs 1
Name: deletedSegmentMot1, dtype: int64
%% Cell type:code id: tags:
``` python
df['deletedSegmentMot2'].value_counts()
```
%% Output
p 6
t 5
ɪn 4
b 4
s 3
n 2
tʌm 1
dʒ 1
sɪl 1
ælfə 1
sem 1
ɡɒd 1
ɪk 1