htaccess tips & tricks

Reading time: 6 – 10 minutes

L’htaccess és un fitxer de configuració per usuaris de l’Apache molt potent. Aquest fitxer es pot posar en qualsevol directori per especificar comportaments específics en la configuració de l’Apache. També s’ha de dir que només podràn usar aquests tipus de fitxers els usuaris que a través del fitxers de configuració principal de l’Apache heredin permisos per fer-ho.

Què es pot fer des d’un .htaccess:

  • Especificar els nostres propis documents d’error
  • Afegir comportaments específics segons tipus MIME
  • Definir variables d’entorn
  • Redirigir URLs
  • Re-escriure URLs
  • Restringir accessos

Aquest document és una traducció-adaptació-ampliació i tot el que he tingut ganes de canviar i afegir del document original: .HTACCESS files useful tips and tricks de Garnet R. Chaney.

UPDATE: Ha sortit la segona part del document: more .htaccess tips and tricks

Especificar els nostres propis documents d’error

Simplement es tracta de no usar els errors estàndars del servidor de hosting que hospeda la nostre pàgina, o sigui, definim quina pàgina s’ha de retorna en els casos que la resposta HTTP no sigui del tipus 200. El més habitual és la pàgina d’error 404 (Not Found), si volem redefinir aquesta pàgina hem de posar al .htaccess, per exemple:

ErrorDocument 404 errors/404.html
Afegir comportaments específics segons tipus MIME

Aquestes macros de servidor el que fan és definir comportaments específics segons el tipus de fitxer i retornar el resultat després d’aplicar el ‘parser’ concret. Per exemple:

AddType text/html .shtml
AddHandler server-parsed .shtml

Si voleu més informació sobre el tema dels ‘handlers’ podeu consultar el manual de l’Apache handlers use i la documentació de mod_include.

NOTA: Article inspirat en: .HTACCESS files useful tips and tricks

Modificar les variables d’entorn del sistema

Com tots sabeu el sistema té una serie de variables d’entorn (veure env i set) que són visibles des de les sessions de l’Apache (veure phpinfo). Doncs bé aquestes poden ser alterades de la següenta manera, per exemple:

SetEnv SITE_WEBMASTER "Jack Sprat"
SetEnv SITE_WEBMASTER_URI mailto:Jack.Sprat@characterology.com
UnSetEnv REMOTE_ADDR
Afegim formats MIME

Les extensions no reconegudes per l’Aapache es consideren formats de text i no es poden descarregar adequadament, així doncs és convenient afegir els tipus MIME no reconeguts per aquest, per exemple:

AddType application/x-endnote-connection enz
AddType application/x-endnote-filter enf
AddType application/x-spss-savefile sav
Restringir l’accés als documents

L’apache permet ristringir l’accés als documents segons molts tipus de factors:

  • per host
  • per tipus de navegador
  • per les credencials enviades via HTTP
  • etc

En el següent exemple es dona accés només per les IPs de la xarxa privada (192.168.*) o pels hoss que acabin en ymbi.net (domini de la meva LAN privada).

order deny,allow
deny from all
allow from 192.168. ymbi.net
Protecció d’accés per autenticació

Per informació sobre aquest tema, us recomano: manual del mod_auth. També val la pena que us mireu mòduls no oficials de l’apache com: mod_auth_mysql com el seu nom indica permet tenir no només la bbdd d’usuarie en fitxers de texta, sinó dins una bbdd mysql. També existeixen coses semblants per postgresql i per ldap. Fins hi tot diria que ho he vist mod_auth_pam interessant,oi?

Protegim l’accés només a un fitxer

Normalment l’.htacces es refereix a tot un directori, per tant si volem referir-nos només a un fitxer en concret ho hem d’especificiar amb la directiva <Files>. En el següent exemple demanem una autenticació per veure el fitxer quiz.html, aquesta es comproba a través del directori LDAP:

<Files quiz.html>
order deny,allow
deny from all
AuthType Basic
AuthName "Characterology Student Authcate"
AuthLDAP on
AuthLDAPServer ldap://directory.characterology.com/
AuthLDAPBase "ou=Student, o=Characterology University, c=au"
require valid-user
satisfy any
</Files>

Un exemple que sempre és molt útil en la vida real és el següent, fins hi tot us recomano que l’useu al fitxer general de configuració de l’apache. El que fa és protegir que ningú pugui llegir els fitxers .htaccess, ja que aquests poden contenir informació sensible:

<Files .htaccess>
order deny,allow
deny from all
</Files>

També existeix una directiva que s’anomena <FilesMatch> i ens permet usar comodins (wildcards) en les restriccions per fitxers.

Redirigint un client

Podem dir-li al servidor que redirigeixi la connexió del client cap a una URL concreta, hi ha diferents tipus de redireccions:

  • permanent – el recurs s’ha mogut de forma permanent
  • temp – s’ha mogut de forma temporal a un altre lloc
  • seeother – el contingut ha estat canviat
  • gone – la informació requerida ha estat elminida de forma permenent

Exemples:

Redirect permanent /psych/subject/timetable http://www.characterology.com/psych/subject/ttable
Redirect gone /psych/subject/1998
Redirect seeother /psych/subject/1999/ /psych/subject/2000/

Més exemples:

RewriteEngine on
RewriteBase /psych
RewriteRule test/printenv(.*) cgi-bin/printenv$1

Com podeu veure es poden usar expresions regulars, aquí en teniu un petit resum:(no ho he traduit per no distorcionar-ho)

  • Patterns (“wildcards”) are matched against a string
  • Normal alphanumeric characters are treated as normal
  • Special characters:
  • . (full stop) – match any character
  • * (asterix) – match zero or more of the previous symbol
  • + (plus) – match one or more of the previous symbol
  • ? (question) – match zero or one of the previous symbol
  • \? (backslash-something) – match special characters
  • ^ (caret) – match the start of a string
  • $ (dollar) – match the end of a string
  • [set] – match any one of the symbols inside the square braces.
  • (pattern) – grouping, remember what the pattern matched as a special variable

Exemples:

  • a+ matches “a”, “aaaa”, “aaaaaaaaaaaa”, but not “bbb”
  • [ab]+ matches, “a”, “b”, or any length combination of the two
  • \.s?html? matches “.htm”, “.shtm”, “.html” or “.shtml”
  • (.+)/1999/(.+) matches “subject/1999/psy1011/”, and also stores “subject” in $1 and “psy1011/” in $2.
  • Més informació: man regex o fins hi tot teniu llibres sencers de can O’Reilly que en parlen Mastering Regular Expressions.

Les redireccions poden ser molt més complexes del que hem vist i podem veure aquí, alguns exemples:

  • Redireccionem de forma condicional, per exemple, quan no existeix un fitxer:
  • RewriteCond %{REQUEST_FILENAME} !-f
    RewriteRule ^(.+)errata\.html?$ cgi-bin/errata/errata-html/$1
    RewriteCond %{REQUEST_FILENAME} !-f
    RewriteRule images/barcode/(.*).gif cgi-bin/barcode/mkgif?$1
  • També podem fer condicions segons les variables d’entorn:
  • RewriteCond %{HTTP_USER_AGENT} ^Mozilla.*
    RewriteRule ^/$ /homepage.max.html [L]
    RewriteCond %{HTTP_USER_AGENT} ^Lynx.*
    RewriteRule ^/$ /homepage.min.html [L]
    RewriteRule ^/$ /homepage.std.html [L]

Si us heu quedat amb les ganes de jugar més amb el tema podeu anar a la documentació d’apache concretament on es parla dels moduls: mod_rewrite i mod_alias.

Com us podeu imaginar això és el que he usat per redirigir les peticions de les imatges del blog, tal com comentava a: Les imatges i l’àlbum de fotos van més ràpids?, aquí teniu el codi de la redirecció:

RewriteCond %{REMOTE_ADDR} !^192.168.1.0/24
RewriteCond %{REMOTE_ADDR} !^192.168.2.0/24
RewriteCond %{REMOTE_ADDR} !^10.0.30.0/24
RewriteRule ^/article_fitxers(.*) http://dades.joor.net/article_fitxers$1