forked from clement-plancq/python-im
-
Notifications
You must be signed in to change notification settings - Fork 0
/
python-4.html
405 lines (325 loc) · 10.4 KB
/
python-4.html
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
<!DOCTYPE html>
<html>
<head>
<title>Python - Cours 4</title>
<meta charset="utf-8">
<style type="text/css">
@import url(http://fonts.googleapis.com/css?family=Droid+Serif);
@import url(http://fonts.googleapis.com/css?family=Yanone+Kaffeesatz);
body {
font-family: 'Droid Serif';
font-size: 20px;
}
h1, h2, h3 {
font-family: 'Yanone Kaffeesatz';
font-weight: 400;
margin-bottom: 0;
}
h1 { font-size: 4em; }
h2 { font-size: 2em; }
h3 { font-size: 1.6em; }
.footnote {
position: absolute;
bottom: 3em;
font-size: 70%;
}
.small{
font-size: 70%;
}
li p { line-height: 1.25em; }
.red { color: #fa0000; }
.large { font-size: 2em; }
a, a > code {
color: rgb(249, 38, 114);
text-decoration: none;
}
code {
-moz-border-radius: 5px;
-web-border-radius: 5px;
background: #e7e8e2;
border-radius: 5px;
font-size: 16px;
}
.pull-left {
float: left;
width: 47%;
}
.pull-right {
float: right;
width: 47%;
}
.pull-right ~ p {
clear: both;
}
#slideshow .slide .content code {
font-size: 0.8em;
}
#slideshow .slide .content pre code {
font-size: 0.9em;
padding: 15px;
}
.inverse {
background: #272822;
color: #777872;
text-shadow: 0 0 20px #333;
}
.inverse h1, .inverse h2 {
color: #f3f3f3;
line-height: 0.8em;
}
.licorne{
background: #FFF0F5; /*LavenderBlush*/
}
.licorne h1{
background: transparent url("http://plancq.clement.free.fr/img/licorne.png") no-repeat;
padding-left: 80px;
color: #8A2BE2;
}
/* Slide-specific styling */
#slide-inverse .footnote {
bottom: 12px;
left: 20px;
}
#slide-how .slides {
font-size: 0.9em;
position: absolute;
top: 151px;
right: 140px;
}
#slide-how .slides h3 {
margin-top: 0.2em;
}
#slide-how .slides .first, #slide-how .slides .second {
padding: 1px 20px;
height: 90px;
width: 120px;
-moz-box-shadow: 0 0 10px #777;
-webkit-box-shadow: 0 0 10px #777;
box-shadow: 0 0 10px #777;
}
#slide-how .slides .first {
background: #fff;
position: absolute;
top: 20%;
left: 20%;
z-index: 1;
}
#slide-how .slides .second {
position: relative;
background: #fff;
z-index: 0;
}
/* Two-column layout */
.left-column {
color: #777;
width: 50%;
height: 92%;
float: left;
}
.left-column-black {
color: #000;
width: 50%;
height: 92%;
float: left;
}
.left-column h2:last-of-type, .left-column h3:last-child {
color: #000;
}
.right-column {
width: 45%;
float: right;
padding-top: 1em;
}
</style>
</head>
<body>
<textarea id="source">
class: center, middle, inverse
# Langages de script - Python
## Cours 4 - Fonctions et module re
### M2 Ingénierie Multilingue - INaLCO
#### Clément Plancq - <small>[email protected]</small>
---
# Fonctions
* Une fonction porte un nom, reçoit des arguments, opére un traitement et renvoie une valeur de retour
* Une fonction *doit* être documentée. En Python on utilise les *docstrings*
```python3
def ma_fonction(arg1, arg2):
"""
La documentation de ma fonction
Sur plusieurs lignes si je veux
"""
return ()
```
* Les *docstrings* sont accessibles dans la console avec `help(ma_fonction)` ou dans le script via l'attribut `__doc__`: `ma_fonction.__doc__`
* Les générateurs de documentation comme [sphinx](http://www.sphinx-doc.org/) utilisent les *docstrings*
---
# Fonctions : arguments
* Arguments positionnels
```python3
def retranche(arg1, arg2):
"""Une soustraction quoi"""
return (arg1 - arg2)
retranche(4, 2)
2
retranche(2, 4)
-2
```
* Arguments avec valeurs par défaut
<small>Ici `arg1` est obligatoire, `arg2` est facultatif</small>
```python3
def retranche(arg1, arg2=1):
"""Une soustraction quoi"""
return (arg1 - arg2)
retranche(4, 1)
3
retranche(4)
3
```
---
# Fonctions : arguments
* Arguments nommés (*keywords arguments* aka *kwargs*)
Les fonctions peuvent aussi être appelées avec des arguments nommés
Dans ce cas l'ordre n'a pas d'importance
On peut mélanger les deux types d'arguments mais alors les keywords doivent être en dernier
```python3
def retranche(arg1, arg2=1):
"""Une soustraction quoi"""
return (arg1 - arg2)
retranche(arg1=4, arg2=2)
2
retranche(arg2=2, arg1=4)
2
retranche(4, arg2=3)
1
```
---
# Fonctions : arguments
* Nombre d'arguments arbitraire
```python3
def print_artist(name, *records):
print(name)
for item in records:
print(item)
print_artist("Neil Young", "Ragged Glory", "Harvest Moon")
```
* On peut aussi utiliser des *kwargs* (keyword arguments)
```python3
def print_artist(name, *records, **concerts):
print(name)
for item in records:
print(item)
for place, date in concerts.items():
print(place, date)
print_artist("Neil Young", "Ragged Glory", "Harvest Moon", Paris='12/10/2016', Albuquerque="14/11/2016")
```
---
# Fonctions : portée des variables
* Les variables déclarées dans le corps d'une fonction ont une portée locale à la fonction
* Les variables globales (c-a-d dans le *main*) sont accessibles en lecture dans une fonction
* Pour modifier une variable globale dans une fonction il faut la faire précéder du mot cle `global`
Souvent source de bug, à éviter
* Les variables passées en arguments ne sont pas modifiées par la fonction
---
class: licorne
# Attention !
## Argument *mutable*
* Les arguments de type *mutable* (list, dictionnaire) peuvent être modifiés par la fonction
```python3
def ma_fonction(val, list):
list.append(val)
return list
list = [1, 2, 3]
ma_fonction(4, list)
[1, 2, 3, 4]
ma_fonction(4, list)
[1, 2, 3, 4, 4]
```
* Si ce n'est pas le comportement voulu il faut penser à faire une copie de la liste
```python3
list = [1, 2, 3]
ma_fonction(4, list[:])
```
---
# Module re
* `re` est un module particulièrement important, vous *devez* lire la [doc](https://docs.python.org/3/library/re.html), absolument
* La doc officielle est parfois aride, ce [*howto*](https://docs.python.org/3.6/howto/regex.html) rédigé par A.M. Kuchling est plus digeste
* *a minima* vous devez connaître les fonctions
* `compile` : compilation d'un motif (*pattern*), retourne un objet `Pattern`
* `findall` : trouve *toutes* les occurences du motif, retourne une liste de chaînes trouvées
* `search` : trouve le motif, retourne un objet Match, None sinon
* `match` : détermine si le motif est présent au début de la chaîne, retourne un objet Match, None sinon
* `split` : découpe une chaîne selon un motif, retourne une liste de chaînes
* `sub` : remplace les occurences d'un motif par une chaîne de remplacement
---
# Module re
* Avec compilation du motif
```python3
pat = re.compile("(\w|\s)+")
if pat.search("Un léopard me pourchasse"):
print("Cours !")
```
* Sans compilation
```python3
if re.search("(\w|\s)+", "Un léopard me pourchasse"):
print("Cours !")
```
* `sub`
```python3
pat = re.compile('e|é')
pat.sub('i', 'éléphanteau')
>>> iliphantiau
```
---
class: licorne
# Module re
## \w et Python3
`\w` est la classe prédéfinie des caractères alaphanumériques.
En Python2 `\w` correspond à [A-Za-z0-9_], avec les locales il est possible d'y ajouter d'autres caractères
En Python3 `\w` correspond à tous les caractères qui ont la propriété Unicode Letter d'après le module `unicodedata` (sauf si le motif est compilé en binaire ou si l'option `re.ASCII` est activée)
```python3
if re.search("(\w|\s)+", "馬青區團長成中央代表"):
print("Yeah !")
if re.search("(\w|\s)+", "هيلاري كلينتون"):
print("Yeah !")
```
---
# Module re
* Les fonctions `match` et `search` renvoient un objet `Match`
* L'objet est évalué comme True s'il est testé mais il peut livrer plus d'informations
* `m.group()` la chaîne trouvée (*matchée*)
* `m.start()` l'indice de la position initiale de la chaîne
* `m.end()` l'indice de la position finale de la chaîne
* `m.span()` le tuple indice début, fin de la chaîne
```python3
m = re.search("l[ae]s?", "Après la pluie, le beau temps")
m.group()
>>> 'la'
```
* Si le motif comporte des groupes de capture :
* `m.group(1)` renvoie la chaîne correspond au 1er groupe, etc.
* `m.groups()` renvoie un tuple comportant autant d'éléments qu'il y a de groupes
```python3
m = re.search("(l[ae]s?)\s(\w+)", "Après la pluie, le beau temps")
m.groups()
>>> ('la', 'pluie')
```
---
# Module re
1. Remplacer les articles 'le' ou 'Le' par 'un' dans la phrase : « Le soir est le moment de la journée où le jour touche à sa fin »
2. Trouver dans le fichier d'export csv de lexique.org les noms dont le lemme se termine par '-ure'. Affichez la liste des formes : ortho / phon / lemme
3. À l'aide du module `requests` trouver les liens hypertextes présents dans la page [https://www.reddit.com/r/Python/](https://www.reddit.com/r/Python/). Affichez la liste suivante : ancre: lien
---
# Exos
1. Le suffixe -able (ou -ible ou -uble) est utilisé pour former des adjectifs à partir des verbes. Vous travaillerez avec les données de [lexique3.81](http://lexique.org/telLexique.php)
1. Pour chaque verbe du premier groupe (utilisez le lemme) vous vérifierez s'il existe un adjectif en -able. Vous donnerez les décomptes en résultat (combien de verbes avec adjectif -able, combien sans)
2. Pour chaque adjectif en -able vous vérifierez s'il existe un dérivé négatif (in-X-able, touchable/intouchable par ex.). En plus de l'affichage des comptes vous donnerez le pourcentage d'adjectifs en -able pour lesquels le dérivé négatif est plus fréquent (utilisez la colonne '7_freqlemfilms2).
2. Codin Game : Racing duals (https://www.codingame.com/ide/puzzle/horse-racing-duals)
</textarea>
<script src="https://gnab.github.io/remark/downloads/remark-latest.min.js">
</script>
<script>
var slideshow = remark.create();
</script>
</body>
</html>